Спарсить контент с сайта
Евгений4 года в сервисе
Данные заказчика будут вам доступны после подачи заявки
29.06.2021
Необходимо спарсить с контентного многостраничного сайта (на wordpress) все статьи, комментарии к ним и сохранить картинки из статей.
Потом воспроизвести весь контент также на wordpress.
У исходного сайта есть rss лента.
сайт который нужно спарсить https://intrigue.dating/
Из каждой категории необходимо спарсить все статьи и комментарии к ним.
Что парсим:
Статья:
- Заголовок
- Количество просмотров
- Категория
- Контент с сохранением форматирования, но вырезать:
- Блок «Содержание статьи»
- Блоки с рекламой
- Картинки – все сохранить в папку для конкретной статьи
- Статьи в которых есть внешние ссылки пометить
Комментарии к статье:
- Имя
- Текст комментария
- Дата комментария