Парсинг сайта (добываем информацию из iframe)

Завершен2 заявки232 просмотра

Парсим каждую из внутренних страниц сайта https://hpjav.tv (осторожно, эротика).

Пример страницы: https://hpjav.tv/73064/dtt-009

Шаг 1. Находим 7 iframe (2 типа) на каждой странице.

Шаг 2. В каждом из iframe находим ссылку на сайт (сохраняем в файл), ссылку на графический файл баннера (сохраняем в файл).

Шаг 3. Переходим по ссылке на сайт (взяли из iframe), (при этом отслеживаем все промежуточные страницы - сохраняем в файл).

Шаг 4. После окончания загрузки (и автоматического прохождения всех промежуточных страниц) - сохраняем финальный URL в файл.

Шаг 1-4 нужно повторить для каждого из 7 iframe на странице.

Вот дополнительная видео-инструкция (осторожно, эротика) https://drive.google.com/open?id=1fSolE2mq_PyofS7RYfDoPxlM5ks-GkK_

Результат должен быть в виде .csv файла со структурой строки (для каждого баннера своя строка):

ссылка на графический файл баннера - URL ; ссылка на сайт - URL ; промежуточные переходы если это возможно (URLs) ; финальный URL

Я должен запускать парсинг самостоятельно на своем сервере.

Технологии: на ваше усмотрение Python + Selenium или zennoposter или что-то аналогичное.

Python Selenium

7 лет назад

Дмитрий Гончаренко

44 года

7 лет в сервисе

Был

5 лет назад

3 отзыва

Выбранный исполнитель

Алексей

34 года

9 лет в сервисе

Был

год назад

36 отзывов

7 лет назад

$21

1 день

Escrow

Отзыв заказчика

Однозначно рекомендую даного исполнителя. Скрипт написан в срок, все пожелания были учтены и потом вносили правки. При этом код структурирован четко, есть комментарии к секциям, все очень прозрачно и понятно. Будем обращаться еще, спасибо!)

Отзыв фрилансера

Благодарю за сотрудничество. Интересная вышла, с визуальной точки зрения, задача)). С оплатой и коммуникацией, полный порядок. Конечно же, я рекомендую Дмитрия.

Заявки фрилансеров

Алексей

34 года

9 лет в сервисе

Был

год назад

36 отзывов

7 лет назад

Похожие заказы
Фантомный след
Страница сайта http://mrsmetamorfa.website/tradify/request_new.html При удалении хештега остается фантомный след (см. скриншот). Такой момент только в Safari, остальные браузеры нормально. Нужна помощь в решении.
Веб-программирование1 исполнитель
Завершен
6 лет назад
Проект закрыт Нужен специалист по WebGL и Three.JS/BabylonJS
Нужно для сайта сделать визуализацию отображения товаров в контейнере. Пример на скриншоте. ТЗ прикреплено. Прошу указывать реальные сроки и цены на работы. Возможна работа через СБР, постоплата, частичная оплата в середине проекта.
Веб-программированиенет заявок
Закрыт
7 лет назад
Парсинг постов из VK
Нужен парсер постов из сообществ (групп/пабликов), базовое описание функционала: - сплошной парсинг постов (никнейм автора, дата/время, текст, смайлы, изображения); - сортировка постов в разделы на основе ключевых фраз (в качестве примера для упрощения ...
WordPress
Веб-программирование3 заявки
Закрыт
6 лет назад
Вывести сайт в зелёную зону по PageSpeed Insights
Необходимо довести сайт http://binarybets.ru/ (на вордпрессе) до значения в 100 (как для ПК, так и для мобильных) или если так не получится, значит хотя бы добиться зелёной зоны https://developers.google.com/speed/pagespeed/insights/ + Нужно адекватно настроить ...
WordPress
Веб-программирование1 исполнитель
Завершен
7 лет назад
Веб Приложение Записи на Прием к Исполнителям
Приложение описано в мозговой карте https://www.mindmeister.com/1195772322?t=9hN9FJLvwm Суть его создании возможности записи на прием к исполнителям запись на прием осуществляется через виджеты которые через iframе могут вставляться в сайты , приложения соц сетей ...
MySQL PHP
Веб-программирование1 исполнитель
Завершен
6 лет назад
Не работает страница в паблике от плагина WP Support Plus
Публичная страница обращений не открывается у обычного автора по какой-то причине. Вроде настройки проверил, но ничего не помогло. Просто белая страница в паблике при попытке захода со стороны автора. ...
WordPress
Веб-программирование2 заявки
Закрыт
6 лет назад
PHP оценка схожести двух текстов
Аналог http://allfacebook.com.ua/images/tmp/2019-01-01_17-41-38.png
PHP
Веб-программирование11 заявок
Закрыт
6 лет назад
PHP кириллический домен извлечь из url-a
$5
Нужно на PHP написать функцию, которая вернет домен по урлу. Примеры урлов: http://allfacebook.com.ua/images/tmp/exm-links.txt
PHP
Веб-программирование1 исполнитель
Завершен
7 лет назад
PHP Перевод через гугл
$5
Нужно изучить https://cloud.google.com/translate/docs/translating-text#translate_translate_text-php И сделать рабочий скрипт для перевода текста.
PHP
Веб-программирование1 исполнитель
Завершен
6 лет назад
PHP Гугл АПИ поиск книг
$5
По запросу найти книги через https://www.google.com/search?tbm=bks&q=%D0%BA%D0%BD%D0%B8%D0%BA%D0%B8+%D0%B4%D0%B0%D0%BD%D1%86%D0%BE%D0%B2%D0%BE%D0%B9
PHP
Веб-программирование1 исполнитель
Завершен
7 лет назад