Фрилансеры предложат решение вашей задачи уже через несколько минут!

Публикация заказа на фриланс бирже не займет много времени.

Сергей Волков
36 лет, Россия
13 лет в сервисе
Был онлайн 4 месяца назад

Дорогие друзья, здравствуйте! В очередной раз вынужден прибегнуть к Вашей помощи :) Нужно написать один скриптик, который позволит собирать контент с других сайтов.

ТЗ в подробной инфой скину в приват. А пока очень кратенько расскажу о сути разработки:

- у нас есть урл, к примеру возьмем сайт http://www.homebusiness.ru/ тут я бы хотел отграбать текстовую информацию с папки http://www.homebusiness.ru/ideas/. Откроем http://www.homebusiness.ru/ideas/1140.htm и http://www.homebusiness.ru/ideas/1143.htm и ищем одинкаковые теги вверху и нузу страниц для того что бы отделить нужный текст:
верх:
<p align="center"><b><font face="Arial" size="3"><a href="http://www.piano-velo.narod.ru" target="_blank"><font color="#FF0000">ТЕМА СЕЗОНА:&nbsp;</font><br>
"Пьяный велосипед" или 14650 рублей за один день</a></font></b></p>
низ:
<p align="center">

<table width="95%" border="0" align="center" cellpadding="6" cellspacing="0" bgcolor="#FFEEEE">
<tr>
<td><div align="center">
а все что между этими тегами просто грабаем :)

- т.к. я не знаю кол-во всех урлов необходимо написать спайдер который будет готовить список ссылок для грабанья. Спайдер должен гулять только по заданной папке, по всему домену, и по всему домену и субдоменам этого домена.

- т.к. робот не может быть идеальным должны быть какие то функции администрирования: это удаление или редактирование текстов

- ну и т.к. некоторые сайты бывают очень большими надо подумать о многопоточности.

Вот и усе. Жду Ваших предложений!