Каталогизатор страниц

Нидеров18 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
27.02.2009

Требуется скрипт, реализованный на PHP5, по функциональности представлющий собой некий аналог сервиса google news.

Имеются порядка 15 рсс фидов с различных сайтов. Точное кол-во фидов будет зависеть от производительности системы. Нужно пропарзить фиды, и распределить найденные статьи по кластерам. Распределение должно идти не по точному совпадению (например, названию), а именно по схожести содержания.

Просьба писать только тем, кто имеет опыт в области автоматизированного разбора текстов.