Утилита для импорта в postgres
Ищу спеца по postgresql, умеющего работать с full text search (fts).
Задача:
Необходимо разработать утилиту для импорта с диска текстовых(только doc, если получится и pdf) документов в базу данных postgres. Документы при добавлении должны быть проиндексированы для последующего полнотекстового поиска. Имеется ввиду не просто "where data like '%чего_то-там'", а именно полнотекстовый поиск. Задача типовая, изыски не нужны.
Требования:
Утилита должна быть реализована на php или c++. Дизайн не нужен, – важны алгоритмы импорта и индексации документов. Также в утилите обязательна должна присутствовать демонстрация полнотекстового поиска по базе – ранжированная выдача по ключевому слову. Т.е. я ввожу, например, "лесной кодекс", а программа мне выдаёт список всех документов которые содержат "лесной кодекс" во всех словоформах. Здесь, опять же, оформлять не нужно, – главное показать что работает алгорим полнотекстового поиска.
Документы для теста можно брать любые. Понимаю, что pdf может быть в виде картинки, поэтому для импорта берём те, из которых можно выделить текст.
Структура таблиц базы данных определяется вами. Комментарии к коду обязательны. Кодировка базы – обязательно UTF-8, т.к. планируются документы на разных языках (английский, русский, греческий).
Сделка без риска.
Ваши сроки и цены.