Парсер с сохранением в csv
Антон12 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
05.01.2019
День добрый.
Нужно написать универсальный парсер с базовым набором функций.
Если предполагается использовать и допилить уже существующее решение, прошу указать об этом.
- Предположительно на php (?). Сохранять данные нужно не в бд, а в csv.
- Должна быть возможность указать массив из страниц-родителей. Т.е. надо парсить только дочерние страницы (на 1 уровень вниз) указанных мною в массиве страниц.
- Данные для парсинга также должны быть произвольные. Т.е. я указываю пару класс или id тега (на выбор) с нужной мне инфой и соответствующий ему столбец в csv. Например "№;ссылкаДонора;КодОтветаСервера;Заголовок;Размер;"
- Также решить проблему с возможным блоком по ip, таймингом. В случае ошибки сервера - должно быть также сохранено в csv ссылка и указание о коде ответа сервера.
- Возможно какие-то ещё нюансы стоит учесть, полагаюсь на ваш опыт. К примеру, копирование изображений по заданному пути "Диск://заданный каталог/№/". + функция транслитерации названий файлов.
Заранее спасибо!