Парсер
Маркалов18 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
29.02.2012
Скрипт php, который исследует страницы сайта на предмет парсинга текста, не входящего в теги, т.е. полезного контента.
На выходе скрипта создается страница из N строк, содержащих полные предложения (от точки до точки) не длиннее X и не короче Y символов и URL страницы, содержащей этот текст.
Если таких N строк не обнаружено подходящих по параметрам, то список дополняется обрезанными строками до X длины.
N,X,Y задаются в параметрах скрипта. Также в параметрах задается задержка между запросами в мс для снижения нагрузки.