Парсер
Задача
Сбор информации о продавцах автозапчастей с сайта irr.ru
Алгоритм.
Заходим http://irr.ru/
В строку поиска забиваем «Для мазда-3». В ответ получеам 15-20 страниц с объявлениями о продаже запчастей. Часть из них выделенна звездочкой или еще чем-то. Часть не стодержит «Для Мазда-3» в принципе. Нам необходимо:
- обработать все страницы ответа поиска;
- выделить те объявления, которые полностью релевантны запросу (точное соответствие фразы);
- скачать объявления, релевантные запросу;
- из этих объявлений составить список с четырьмя колонками, например:
Автомобиль Текст Телефон (телефоны) Даты выхода
объявлений
Для Мазда-3 запчасти б/у: капот, фара левая, радиатор
охлаждения, панель передняя, крыло правое,
продаю. 8-916-487-59-29 26.12.2008
- этот список сгруппировать по номерам телефонов, если строк с таким номером телефона более одной – оставляем полностью текст первой строки, и добавляем в эту строку даты выхода других объявлений, с этого-же телефона.
- Объявления, выделенные цветом, звёздочкой или чем ещё – в поле ТЕКСТ оббавляем в самое начало «* » (звёздочка и пробел);
- далее сортируем список по минимальному количеству дат выхода и возвращаем пользователю;
- эту-же информацию сохраняем в .csv (и/или xls) файле, в специально созданной директории;
- пользователю предлагается ссылка для скачивания этого файла.
оплата WM по факту выполнения
ставки без цены и сроков не рассматриваются
новички (кто в сервисе менее месяца) а также студии - проходим мимо
ваши предложения не видны другим