Написать парсер для product.ru
Портал: http://www.product.ru/
На главной странице открываются разделы каталога компаний. Интересует 2 раздела СЫРЬЕ/СЕЛЬХОЗТОВАРЫ – ОВОЩИ/ФРУКТЫ и ГРИБЫ/ЯГОДЫ
Необходимо распарсить все объявления в этих разделах.
Кроме каталога на портале есть также доска объявлений: http://www.product.ru/vmainob.asp?k=1
Там есть «Объявления о продаже» и «Объявления о покупке». В этих двух разделах интересуют подразделы: «Продам продукты/сырье», «Куплю продукты/сырье» соответственно. Оттуда необходимо взять все объявления, в тексте которых присутствует хотя бы одно из нужных нам названий товаров. Список с названиями товаров прилагается в отдельном файле к данному ТЗ.
Необходимо отпарсить объявления за весь период. Полученные результаты представить в виде файла формата excel или cvs. В парсере необходимо предусмотреть возможность исключить повторный парсинг одних и тех же объявлений при повторном запуске парсера.
Сделать парсер надо как приложение, чтобы была в последующем возможность его запускать самостоятельно.
Обязательным условием является предоставление базы и исходников парсера.
Более подробная информация во вложении