Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

ЗАДАЧА

Нужно написать парсер, который будет проходить по списку выданных сайтов и собирать контактную информацию.

1. Все сайты это финские компании с одним и тем же видом деятельности.

- Структура сайтов и дизайн разные.

- Степень защиты сайтов разная

2. Собирать надо все контактные данные, которые имеются.

(Порядок и наличие данных может быть разным, в зависимости от сайта.)

- Название отдела - по возможности

- Имя Фамилия - по возможности

- Должность - по возможности

- Телефон - обязательные данные

- Email - обязательные данные

3. Парсер должен искать данные в футере/хедере, также, заходить в раздел "контакты"/"о нас" и искать там, так как зачастую в футере/хедере может не быть данных или там только почта фирмы, а не CEO и т.д

КОНТАКТНЫЕ ДАННЫЕ

- Контактные данные - (то есть Название отдела, Должность, Имя Фамилия, телефон, email)

- Расположение контактных данных могут быть как на главной странице так и на отдельной предназначенной странице.

- Расположение контактных данных может быть как в шапке сайта, в футере, так и в любом другом месте на странице.

- На сайте может быть только один телефон и один email.

ВЫВОД РЕЗУЛЬТАТОВ

Вывод результатов должен быть в виде CSV файла

Данные должны быть структурированы (например номер телефона и почта) должны быть связаны друг с другом, чтобы было понятно, какой номер телефона принадлежит какой почте.

По возможности данные должны быть отфильтрованы от лишних данных (дубликатов и нерелевантных данных)

ИТОГ

Конечным продуктом является рабочий парсер с исходным кодом и с документацией, в котором можно самостоятельно заменять ссылки и чтобы он выполнял вышеуказанные задачи.

ДОПОЛНИТЕЛЬНО

К заданию прикреплен файл с частью ссылок для примера, а также скриншоты того какие именно данные собирать на сайте, а также пример того как полученные данные приблизительно должны выглядеть.

год назад
guest_16678960591817
год в сервисе
Был
год назад
  • Похожие заказы
  • Создать на python плагин для QGIS3 (или описать алгоритм как можно сделать иначе), где можно указать "уровень затопления в метрах" и получить в отдельном слое модель затопления Байкала (водохранилища).

    Закрыт
    год назад
  • Полная занятость/Проектная работа/Удаленная работа Мы создаем проект по автоматизированной работе с YouTube и другими видео-стриминг платформами. Требования: - Глубокое знание JS и браузеров на базе Chromium - Навыки в reverse engineering - Опыт в работе с расширениями для Chromium-based браузеров - ...

    Закрыт
    год назад
  • Нужно сделать с помощью QT Designer простой блокнот, состоящий из нескольких форм и реализующий весь нужный функционал записи и редактирования. Опишу всё подробнее в личных сообщениях.

    Закрыт
    год назад
  • Добрый день, нам необходимо создать программу для репостов рилс в сторис с ВЕБ версии Инстаграма. Проблема в том, что когда заходишь через обычную веб версию Инстаграма, то технически нет кнопки "самолетика", чтобы сделать репост себе в ...

    Закрыт
    год назад
  • $10

    Необходимо написать бота, способного:1. Через условную команду /add запрашивать номер телефона пользователя2. Отправлять код подтверждения по номеру телефона и принимать его от пользователя с проверкой на корректность, после чего входить в аккаунт пользоваться и сохранять ...

    Закрыт
    год назад
  • $500

    Есть скрипт, написанный на Python (Selenium) - он эмулирует поведение обычного пользователя в instagram.  Работают все обычные действия пользователя, кроме одного - репост поста (рилса) в историю. То есть задача следующая - разработать скрипт, который будет делать ...

    Закрыт
    год назад
  • $70

    [list][*]Нужно написать такой парсер (и потом отдельным проектом еще его усложнить):[*]Задается номер прохода (переменная icp, например, icp=4)[*]Исходный файл со списком контактов берется исходя из номера прохода, например, 4-sourced-leads.csv[*]Из 10ого столбца исходного файла берем Linkedin company ...

    Закрыт
    год назад
  • Онлайн игра [url=https://freelancehunt.com/out?url=https%3A%2F%2Fluckyjet24.com%2F]https://luckyjet24.com/[/url] в казино выдает коэффициенты окончания раунда. Необходимо их копировать и вставлять в таблицу excel. Игра создана на unity. И такой же аналог в онлайн казино 1win. Тут можно вытаскивать через элементы сайта.

    Закрыт
    год назад