PHP-парсер линков
Интерфейс не требуется.
Скрипт должен запускаться по крону. Время крона: 1 минута.
Очень важна скорость выполнения скрипта.
Можно делать сокетами, но можно и с Curl'ом, как Вам удобней.
Имеется две таблицы в базе данныйх MySQL, содержащие URL-адреса:
- первая таблица содержит линки, ведущие на страницы/вэбсайты, которые содержат в своём исходном тексте URL-адреса из второй таблицы; Эта таблица содержит ID УРЛа из второй таблицы;
- вторая таблица содержит линки (URL-адреса) которые надо найти исходя из первой таблицы;
Все УРЛы в обеих таблицах всегда абсолютные.
УРЛы в базе сохранены без http:// и без https:// .
Т.е. при заходе по УРЛ вы подставляете http:// , но могут попадаться сервера и с HTTPS.
При посещении сайтов по каждому из линков первой таблицы, в случае необходимости, надо ожидать до 30 секунд (по-умолчанию) пока загрузится страница. Время ожидания должно выставляться в переменной в началае скрипта.
Если с первого раза зайти на сайт не получилось, то надо зайти снова через 7 часов. Всего должно быть по-умолчанию 3 попытки захода по линку из первой таблицы на сайт. Количество попыток заходов должно выставляться в переменной в начале скрипта.
Если получилось зайти на сайт, то надо найти в его исходном коде УРЛ из второй таблицы. Вторая таблица имеет колонку с флагом 1 или 0 (для обозначения "найдено" или "не найдено" соответственно).
В третьей таблице базы скрипт ведёт лог своей работы.
Оплата сдельная. Договорная.
Предложения типа «я всё могу, пишите мне в личку…» или «вот моё мыло, пишите мне…» — ОТКЛОНЯЮТСЯ СРАЗУ!
Контакт по Skype.
Мой ник: sabia-sd