Фрилансеры предложат свои варианты уже через несколько минут!
Публикация заказа не займет много времени.

Поиск фактов (Data-mining)

Выделение смысловой части страницы.
На вход: произвольный HTML документ
На выход: текстовая часть без мусора вроде навигации, копирайтов и т.д. только то что нужно читать на странице.


Тегирование сущностей.
Определение "особых слов" в тексте (имена собственные, географические названия, суммы, даты).


Структурирование фактов
Определение связи между упоминаемыми людьми и фактами.
Кто - Что делает/как относится - что/к чему.