PHP-парсер линков

Антон19 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
06.12.2012

Интерфейс не требуется.

Скрипт должен запускаться по крону. Время крона: 1 минута.

Очень важна скорость выполнения скрипта.

Можно делать сокетами, но можно и с Curl'ом, как Вам удобней.

Имеется две таблицы в базе данныйх MySQL, содержащие URL-адреса:

- первая таблица содержит линки, ведущие на страницы/вэбсайты, которые содержат в своём исходном тексте URL-адреса из второй таблицы; Эта таблица содержит ID УРЛа из второй таблицы;

- вторая таблица содержит линки (URL-адреса) которые надо найти исходя из первой таблицы;

Все УРЛы в обеих таблицах всегда абсолютные.

УРЛы в базе сохранены без http:// и без https:// .

Т.е. при заходе по УРЛ вы подставляете http:// , но могут попадаться сервера и с HTTPS.

При посещении сайтов по каждому из линков первой таблицы, в случае необходимости, надо ожидать до 30 секунд (по-умолчанию) пока загрузится страница. Время ожидания должно выставляться в переменной в началае скрипта.

Если с первого раза зайти на сайт не получилось, то надо зайти снова через 7 часов. Всего должно быть по-умолчанию 3 попытки захода по линку из первой таблицы на сайт. Количество попыток заходов должно выставляться в переменной в начале скрипта.

Если получилось зайти на сайт, то надо найти в его исходном коде УРЛ из второй таблицы. Вторая таблица имеет колонку с флагом 1 или 0 (для обозначения "найдено" или "не найдено" соответственно).

В третьей таблице базы скрипт ведёт лог своей работы.

Оплата сдельная. Договорная.

Предложения типа «я всё могу, пишите мне в личку…» или «вот моё мыло, пишите мне…» — ОТКЛОНЯЮТСЯ СРАЗУ!

Контакт по Skype.

Мой ник: sabia-sd

Заявки фрилансеров