Сделать парсер сайта
На портале интересует раздел «Офис и бизнес» - «Оптовая торговля»: http://dmir.ru/business/wholesale/all.aspx
Регион возможно выбрать – «Россия».
Однако на данной доске объявлений стоит ограничение на показ 1000 объявлений. Т.е. больше 1000 не покажут. Поэтому при парсинге необходимо пройтись поочередно по каждому из регионов, чтобы система показала максимальное количество объявлений. Регион выбирается вверху страницы.
Из объявлений, которые отражаются здесь: http://dmir.ru/business/wholesale/all.aspx , необходимо выбрать те, в заголовке или тексте которых встречается слова из нашего списка овощей и фруктов (см. аттач).
Через строку метапоиска вверху страницы поиск не производить, т.к. тогда собираются результаты из всех рубрик и появляется много мусора. Типа такого: «Продам кота Петрушку».
Более подробное описание в аттаче.