Парсинг информации с сайта
Иван13 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
31.03.2014
Нужно спарсить информацию блога в таком виде:
1. открываем страницу со статьями вида
2. парсим содержимое каждой конечной статьи
3. анализируем содержимое статьи и сохраняем в csv файл внешние ссылки, которые были найдены в статье (внутренние не надо) — содержание файла: http://c2n.me/77YGyn.png
ID — это айди статьи, которая указана в поле URL_Article
Автор - автор статьи
Название - из тайтла
URLS - внешние ссылки внутри статьи
Количество страниц со статьями — 35, количество статей на странице — 10. т.е. итого: 350 статей
-
структура сайта логичная и регулярками легко распарсится. После выполнения первого задания нужно будет отпарсить еще два аналогичных сайта по цене 20 вмз за каждый.
20 вмз