Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Необходимо написать парсер для сбора данных с сайта

  • В папке с парсером должна быть инструкция - как его запускать (если вдруг сервер перезагрузится)
  • Каждая вакансия записывается с новой строки в формате: ;Ссылка;телефон;телефон2;имя менеджера;вакансия;почта;компания;
Если каких-то данных нет, например названия вакансии, то результат должен выглядеть так: ;Ссылка;телефон;телефон2;имя менеджера;;почта;компания;

  • Помимо txt файла result.txt парсер должен собирать данные (дублировать) и в txt файл arhive.txt, который также находится в директории проекта. Это архив со всеми данными, собранными ранее. В нем данные храняться также как и в result.txt. Мы будем раз в день забирать данные из result.txt (и чистить файл), а в arhive.txt они будут оставаться.
  • Необходимо, чтобы парсер работал без остановки, собирая новые данные с сайта. Когда он пройдет по всем объявлениям на сайте - необходимо собирать заново. Парсер должен работать круглые сутки и собирать все обновленные данные на сайте. Раз в день файл должен отправляться в чат телеграмм и после этого чиститься, в файле же архив данные не удаляются
  • Также важно, чтобы парсер собирал все данные, не пропуская ни одной страницы с объявлением. Поэтому нужно сделать запросы или регулярные выражения максимально надежными
  • Чтобы собрать все данные возможно потребуется сгенерировать ссылки на выдачу с различными фильтрами так как по одному фильтру как правило доступно ограниченное количество вакансий. Но нам необходимо, чтобы собирались объявления по всей России, в каждом городе. На текущий момент работает логика, когда в отдельном списке присутствует множество ссылок на поисковые выдачи с различными параметрами, парсер собирает по всем данные, удаляя дубли.
Список сайтов, по которым нужны парсеры отправим. Это любые работные сайты (если есть предпочтение - можете выбрать сами и написать). Начнем с одного сайта - парсера, если работа будет выполнена хорошо - готовы продолжить работать дальше
2 года назад
guest_16855388298861
Россия
2 года в сервисе
Была
9 месяцев назад
Заявки фрилансеров
Юрий
 
24 года
2 года в сервисе
Был
6 месяцев назад
2 года назад
Умид
 
33 года
3 года в сервисе
Был
2 года назад
2 года назад
Вадим
 
26 лет
4 года в сервисе
Был
год назад
2 года назад
Максим
 
48 лет
18 лет в сервисе
Был
8 дней назад
2 года назад
Мухаммад
 
30 лет
2 года в сервисе
Был
2 года назад
16 отзывов
2 года назад
Евгений
 
38 лет
16 лет в сервисе
онлайн
556 отзывов(-1)
2 года назад
Нуркадыр
 
26 лет
5 лет в сервисе
Был
месяц назад
7 отзывов
2 года назад
  • Похожие заказы
  • Требуется разработка чат-бота для магазина в Telegram, который будет отвечать на стандартные вопросы пользователей. Ответы будут предоставляться из документа, а статус заказа будет получен из 1С. Укажите примерные сроки и стоимость реализации проекта.

    Закрыт
    2 года назад
  • Требуется разработать код на Python для получения информации со сканера штрихкода. Необходимо создать прикладное ПО, которое будет обрабатывать данные, поступающие от устройства. Ожидается качественное и оптимизированное решение.

    Закрыт
    2 года назад
  • Требуется разработать кроссплатформенное GUI приложение, аналог MyRuLib или freeLib. Основной функционал включает поиск по SQLite, отображение результатов, получение обновлений и скачивание файлов. Разработка на C++ или Python с использованием Qt или wxWidgets. Поддержка Windows и Linux.

    Закрыт
    2 года назад
  • $200

    Разработка музыкального Lite плеера для прослушивания и загрузки музыки из социальной сети ВКонтакте. Плеер должен поддерживать вход с двухфакторной защитой и не использовать AppID. Ожидается создание функционального и простого в использовании приложения.

    Закрыт
    2 года назад
  • Разработайте Python скрипт для обмена USDT между сетями BNB и COREDAO на платформе https://bridge.coredao.org/bridge. Скрипт должен загружать нужное количество с кошелька, позволять устанавливать диапазоны задержки и суммы транзакций, а также вести логирование операций.

    Закрыт
    2 года назад
  • Разработать парсер для извлечения всех объявлений из указанной категории OLX в формате CSV. Состав CSV должен включать имя, телефон, заголовок, описание, ссылки на картинки и город. Предпочтительно создать UI программу для Windows. Опционально добавить возможность перезаливки картинок на сервер с выводом ссылок.

    Прикладное ПО1 исполнитель
    Завершен
    2 года назад
  • Требуется разработать программу, реализующую нециклическую очередь на основе массива с использованием языка программирования C++. Задача включает в себя решение лабораторной работы, подразумевающей создание и управление очередью.

    Закрыт
    2 года назад
  • $60

    Требуется разработать парсер для сайта, который будет собирать информацию о товарах с аккаунта работника. Парсер должен авторизовываться, загружать данные в формате .csv и, при наличии изображений, загружать их на фотохостинг с сохранением ссылок. Ключевые требования: надежность, возможность обработки больших объемов данных и хорошая документированность кода. Исходный код и примеры работы должны быть предоставлены.

    Прикладное ПО1 исполнитель
    Закрыт
    2 года назад
  • $400

    Требуется разработать микросервис, который будет обрабатывать команды покупки и продажи NFT через блокчейн Эфир. Необходимо интегрировать сервис-прослойку для работы с блокчейном и создать смарт-контракт. Ищем программиста с опытом работы с Эфиром и написанием смарт-контрактов. В заявке указывать ставку в час и свободные часы для проекта.

    Закрыт
    2 года назад
  • Требуется обучить модель Tacotron2 для синтеза речи по предоставленным аудиозаписям и транскриптам. Необходимо создать модель в формате .pth и wavegan вокодер в формате .pkl для программы синтеза речи. Задача срочная.

    Прикладное ПОнет заявок
    Закрыт
    2 года назад