Парсер товаров в CSV + папка с фото
Парсер карточек лотов и фотографий с www.адрес_в_ТЗ_из_архива.ru
Задача спарсить объекты с фото с www.адрес_в_ТЗ_из_архива.ru
Лотов к парсингу ок. 2500, некоторые из них с фото.
Вывод данных в таблице XLS формата (порядок столбцов описан ниже и по ссылке + несколько доп. столбцов с важными для лота данными: дата и др.):
irr.ru/site/files/xls_files/real-estate/real-estate.rent.xls
Пример заполненный по одному объёкту с сайта в этом же файле, за номером 1.
Все дополнительные параметры, которые не вошли в описание CSV файла - дополнительными столбцами справа от основных. В примере так же расписано.
При этом желательно, чтобы все данные были занесены в ячейки с учётом техтребований формата, т.е. с использованием нужных словарей и т.п., описание тут:
http://irr.ru/help/forCompanyi/interSellers/
Раздел: Автоматическая загрузка объявлений // Cоставление файла в CSV формате // 2. Заполните обязательные и необязательные поля
1. Поля с произвольными значениями
2. Поля с числовыми значениями
+ словарь: http://irr.ru/site/files/xls_files/real-estate.txt
По фотографиям: имена спарсенных с www.адрес_в_ТЗ_из_архива.ru фотографий, через запятую, вносятся в соотв. ячейку XLS.
Сами фотографии парсятся в одну папку "www.адрес_в_ТЗ_из_архива.ru_Foto", все вместе.
Есть код проксилиста с hideme.ru, если надо - вставим.
И уже итоговый файл, с заполненными столбцами (включая столбцы фоток из карт отдельно), сохраняется в папке итогов парсинга.
Решение должно работать через денвер и иметь возможность редактирования параметров парсинга (если изменится источник).
Итоги проекта: CSV файл + папка с фотографиями.
Полностью заполняем параметры заявки: сроки, бюджет до предложенного и комментируем по-делу.