Спарсить данные с сайта по Sitemap
Роман16 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
03.08.2017
Здравствуйте, необходимо спарсить данные с одного зарубежного сайта. Парсить нужно только заголовки страниц и хлебные крошки.
Всего сайтмэпов 400 штук, они идут архивом .xml.gz, необходимо получить содержимое каждого файла, перейти на страницу и вытянуть необходимые данные. В каждом файле по 50 000 урлов должно быть.
В итоге мне нужен csv файл с разделителем ";" на 20 000 000 строк, либо .txt файл, возможно несколько таких файлов как-то структурировано.
От Вас цены и сроки за полный парсинг или за написание парсинга под сайт для самостоятельного парсинга по урлам сайтмэпов.