Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Есть 100 сайтов, по которым нужно организовать индексацию и поиск

Поисковый механизм должен быть написан на С/C++, уметь быстро индексировать, иметь возможность доработки. Работа с русской морфологией не является обязательным условием.

Обязательные характеристики поиска:

1. Страницы должны индексироваться до 3-х уровней в глубину.

2. Поиск должен учитывать PR страниц , и количество исходящих ссылок на странице. (модуль определяющий PR и к-во исх. ссылок уже готов, он хранит информацию в БД. Нужно настроить поиск так, чтобы он учитывал эти данные в результатах поиска)

3. Поиск должен уметь искать фразы. Длинные либо короткие, с точным вхождением слов. Например, если на какой-либо странице есть фраза: «This website is designed for SEO Experts», и страница находится в индексе, то поиск по точной фразе должен успешно осуществляться.

4. PHP Frontend – возможность работы с PHP.

Желательные характеристики

1. Возможность доработать краулер (спайдер) так, чтобы он индексировал конкретные части страниц, например, только контентную уникальную часть. Алгоритм реализации уже есть. Нужно иметь возможность дорабатывать сам поисковый механизм.

2. Многопоточность индексации, индексация должна уметь работать многопоточно в указанное к-во потоков.

Нужен специалист, который имеет реальный практический опыт решения задач поиска информации. Рассматриваются конкретные предложения.

15 лет назад
yvladimir
38 летУкраина
15 лет в сервисе
Был
3 года назад