Спарсить каталог
Нам нужно спарсить три категории на сайте - http://goo.gl/yN3WXe
https://yadi.sk/i/fBDSFxoRtr73R
и в каждой из трех категорий, например , в этой
страница с категориями товаров, нужна каждая подкатегория и всё что внутри
подробнее:
В каждой породе есть 4 разных вида информации, которые нам и надо спарсить, 1я картинка + описание https://yadi.sk/i/8HyyrVp4tr6dC , ссылка - http://goo.gl/c5LSuz
И вторая картинка (шлиф) + описание (шлифа) которая открывается при нажатии на маленькую картинку в углу основной - https://yadi.sk/i/7omVqr6Wtr6tm ссылка - http://goo.gl/IU44FZ
на выходе надо получить файл cvs , а картинки отдельно , причем в cvs столбцы должен быть c id_img1 и id_img2 - которые будет совпадать с названием картинок (чтобы было понятно какая картинка куда)
структура такая
№ | категория | подкатегория | название породы | url породы | основное описание породы | id_img породы | url картинки породы | url шлифа | описание шлифа | url картинки шлифа | id_img шлифа