Робот-парсер веб-страниц
Разработать web-прилжение (Perl, PHP) робота-парсера.
Основные функции:
- автоматический обход сайтов по доменным зонам;
- определение текста в тегах TITLE и H1;
- выделение текста на странице;
- определение плотности вхождения ключевых слов и фраз в тексте;
- определение адресов (анкеров) и названий ссылок в навигации;
- накопление в БД.
Присылайте плиз ссылки на примеры, работающих web-приложений. Опишите функии
которые они выполняют.
---------------------------------------------------
Заказывайте мини-атс: http://atc-spb.ru
Присылайте пожалуйста на ящик свои конкретные предложения, и ОЧЕНЬ прошу без общих фраз.
Напишите перечень выполняемых функций web-приложения + ссылки на
примеры работающих пауков.
E-mail: [email protected]