Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

День добрый.

Нужно написать универсальный парсер с базовым набором функций.

Если предполагается использовать и допилить уже существующее решение, прошу указать об этом.

  • Предположительно на php (?). Сохранять данные нужно не в бд, а в csv.
  • Должна быть возможность указать массив из страниц-родителей. Т.е. надо парсить только дочерние страницы (на 1 уровень вниз) указанных мною в массиве страниц.
  • Данные для парсинга также должны быть произвольные. Т.е. я указываю пару класс или id тега (на выбор) с нужной мне инфой и соответствующий ему столбец в csv. Например "№;ссылкаДонора;КодОтветаСервера;Заголовок;Размер;"
  • Также решить проблему с возможным блоком по ip, таймингом. В случае ошибки сервера - должно быть также сохранено в csv ссылка и указание о коде ответа сервера.
  • Возможно какие-то ещё нюансы стоит учесть, полагаюсь на ваш опыт. К примеру, копирование изображений по заданному пути "Диск://заданный каталог/№/". + функция транслитерации названий файлов.
Стоимость подобной работы не могу знать, тут на ваше усмотрение.

Заранее спасибо!

5 лет назад
parkgraphic
Антон 
36 летРоссия
11 лет в сервисе
Был
3 года назад