Парсинг страниц сайта
Иван13 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
08.07.2014
Нужно спарсить все страницы сайта, используя карту сайта
http://www.wired.com/sitemap.xml
на конечные страницы карт сайта:
http://www.wired.com/sitemap.xml?yyyy=2014&mm=07&dd=08
и сохранить URL страниц в виде CSV со столбцами:
url раздела; URL страницы; дата
получится такой список:
15 wmz