Добрый день! Нужно написать парсер сайта.

На сайте в виде блога представлены постранично посты с кратким описанием. Если перейти по ссылке, то попадаем на страницу с полным описанием поста. Вот такие посты и нужно спарсить.

Парсить нужно категорию, заголовок, ссылку на изображение, описание, файлы (архивы).

Результат парсинга заносить в базу (выгружать в csv). Файлы оптимальнее парсить если возможность на google drive (если есть такая возможность). Парсер должен пробегать по сайту и проверять обновление постов. Если появились посты новые, которые нет в базе, то добавлять (а не парсить все по новой).

Язык программирования предпочтительнее PHP (предлагайте другие - обсудим). Главное, чтобы в управлении парсера можно было разобраться. Можно и как десктопное приложение (PHP, C#, Python и др). Главное, чтобы был хоть какой-то интерфейс.

4 года назад
Metrologik
Рустем 
42 года
6 лет в сервисе
Был
4 года назад

Заявки фрилансеров

Денис
 
24 года
5 лет в сервисе
Был
3 года назад
4 отзыва
4 года назад
Ислам
 
20 лет
4 года в сервисе
Был
4 года назад
4 года назад
  • Похожие заказы

  • $15

    Требуется доработать существующий PHP-скрипт для проверки доменов на признаки CMS и технологий. Необходимо исправить некорректные функции и изменить формат вывода на список. Скрипт основан на браузерном расширении Wappalyzer и должен соответствовать его функционалу.

    Закрыт
    4 года назад
  • Требуется срочная верстка двух заданий. Первое - создать динамическую диаграмму, которая изменяется в зависимости от JSON данных. Второе - сверстать блок с четырьмя видами квадратиков, размещая их согласно предоставленной картинке. Все необходимые картинки будут предоставлены.

    Закрыт
    4 года назад
  • Требуется разработка эквайринга на PHP, использующего сервис card-to-card. Необходимо создать функцию, принимающую данные карты клиента, данные карты для получения и сумму, которая будет возвращать URL для редиректа на 3DS-проверку или HTML-код для ввода пользователем. Использование антикапчи и прокси обязательно.

    Закрыт
    4 года назад
  • Требуется разработать многопользовательский комментатор web-страниц на Python. Проект включает уведомления о событиях и отображение комментариев. Укажите стоимость часа работы и оценку по времени реализации проекта.

    Закрыт
    4 года назад
  • Необходимо разработать страничку сайта с полем для ввода слова и кнопкой 'Разобрать'. При нажатии кнопки должен отображаться разбор введенного слова. Важно также уделить внимание дизайну страницы, чтобы она выглядела привлекательно и не была простой на белом фоне. Подробности разбора указаны в техническом задании.

    Завершен
    4 года назад
  • Необходимо доработать сайт foodtherapy.ua, связать его разделы и функционал. Верстальщик уже есть. Обязательна личная встреча для обсуждения деталей и условий оплаты.

    Закрыт
    4 года назад
  • Необходимо спарсить данные с сайта, включая текст и изображения. Задача включает конвертацию видео с сервера и YouTube в mp3, обработку картинок (зеркальное отражение, обрезка) и массовый перевод текста с помощью Google или Яндекс. Сроки выполнения должны быть четкими и фиксированными.

    Закрыт
    4 года назад
  • Требуется скопировать сайт-донор, включая все три файла: роутинг, главную страницу и страницу поста. Настроить макросы для редактирования, чтобы пользователь мог легко вносить изменения после рипа шаблона. Проект должен быть готов 'из коробки' с возможностью дальнейшей настройки.

    Закрыт
    4 года назад
  • $1166

    Требуется разработка бэкэнда сайта на Django с привязкой к предоставленной верстке. Также необходимо создать Telegram-бота. Техническое задание будет предоставлено исполнителю. Обратите внимание на пример бота для ориентировки.

    Завершен
    4 года назад
  • $1180

    Требуется разработка бэкэнда сайта на Django с привязкой к верстке. Также необходимо создать Telegram-бота, аналогичного приведенному примеру. Верстка и техническое задание будут предоставлены исполнителю.

    Закрыт
    4 года назад