Паук, который скачивает текст со страницы сайта.
Нужен простой паук, который заходит на страницы сайтов по заранее подготовленному списку ссылок и собирает оттуда только видимый текст отрывков фраз по ключевым словам. Собранные тексты нужно поместить в базу данных.
Таблица -
заранее известные параметры, которые уже будут в таблице
1. адрес ссылки страницы,
2. название ссылки страницы
3. контакты владельца страницы
4. список ключевых слов для поиска фраз видимого текста
неизвестный параметр, который должен взять паук
5. видимый текст отрывков фраз
======================
Пример - паук заходит на страницу песни, по ключевой фразе "давай споем" ищет текст вокруг этой фразы "ну давай споем ещё раз" и добавляет его в базу данных (пункт 5).
======================
Паук должен работать на хостинге линукса. Критерии поиска и отбора отрывков видимого текста тоже простые.
Нужен исполнитель с опытом в данной сфере.