Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

На сайте размещен каталог исполнителей.

Нужно собрать часть текстовых данных из него.

Единицей сохранения должны быть предложения, разделенные точкой (кроме ситуации, когда точка используется для сокращении слова; нужно добавить в исключения ситуации, если перед точкой стоит менее 3 букв, например, г. или гг. - в таком случае не разделять на предложения).

Ссылки на разделы сайта, откуда парсить данные, я предоставлю. Все разделы имеют одинаковую структуру, сохраняются в одинаковом порядке. Всего будет около 150 разделов.

Подразделы (одинаковые в каждом разделе): Образование, Опыт, О себе

--

Напишите вашу стоимость, когда можете начать, ориентир завершения. Если в работе много проектов, давайте реалистичные сроки.

3 года назад
d654525
Эдуард 
59 летРоссия
9 лет в сервисе
Был
месяц назад
  • Похожие заказы
  • Здравствуйте Нужен парсер который будет работать на сервере. Скорее всего на PHP но рассмотрю другие предложения [b]Сайты которые нужно парсить:[/b] [url=http://board.ntsk.ru/index.php?r=category&category_id=10]NTSK[/url] ([url=http://board.ntsk.ru/index.php?r=category&ads_city=5562&category_id=14&ads_type[]квартиры[/url], [url=http://board.ntsk.ru/index.php?r=category&ads_city=5562&category_id=15]комнаты[/url], [url=http://board.ntsk.ru/index.php?r=category&ads_city=5562&category_id=12&ads_type[]дома[/url]) [url=https://www.avito.ru/novotroitsk/kvartiry/prodam/vtorichka-ASgBAQICAUSSA8YQAUDmBxSMUg?f=ASgBAQICAUSSA8YQAkDmBxSMUpC~DRSWrjU]avito[/url] [url=https://orenburg.cian.ru/cat.php?deal_type=sale&engine_version=2&location%5B0%5D=4898&offer_type=flat&room1=1&room2=1&with_neighbors=0]ЦИАН[/url] ([url=https://orenburg.cian.ru/cat.php?deal_type=sale&engine_version=2&is_by_homeowner=1&location%5B0%5D=4898&object_type%5B0%5D=1&offer_type=flat&with_neighbors=0]квартиры[/url], [url=https://orenburg.cian.ru/cat.php?deal_type=sale&engine_version=2&is_by_homeowner=1&location%5B0%5D=4898&object_type%5B0%5D=1&offer_type=suburban&with_neighbors=0]дома[/url], [url=https://orenburg.cian.ru/cat.php?deal_type=sale&engine_version=2&is_by_homeowner=1&location%5B0%5D=4898&offer_type=flat&room0=1&with_neighbors=0]комнаты[/url]) [url=https://multilisting.su/g-novotroitsk/sale-residential?advertisement%5Bowner%5D=1]мультилистинг[/url] [list=1][url=https://multilisting.su/g-novotroitsk/sale-residential?advertisement%5Bowner%5D=1][/url] [/list] [b]Схема работы парсера:[/b] [list=1][*]Парсер собирает информацию с сайтов из списка с заданной ...

    Закрыт
    3 года назад
  • Веб сервис по преобразованию справки 2 НДФЛ в декларацию 3 НДФЛ с помощью ocr (технологии оптического распознавания текста) с возможностью интеграции через Api Процесс: 1. Формирование папки на клиента (идентификация по номеру телефона, ФИО и адресу электронной ...

    Закрыт
    3 года назад
  • $39

    Статистические данные для конкретной области сейчас выводятся через JS (хотя они есть в БД), что нагружает сайт по мере увеличения их объёма и размера файла. Нужно выводить их со стороны бэка через PHP. Подробное описание, пример ...

    Закрыт
    3 года назад
  • Сразу : не нужно предлагать тильду, вп и им подобные решения! как вариант, реализовать на react, html5. Для html-сайта нужно создать раздел для добавления (постинга) коротких новостей - мемов, цитат, картинок, коротких заметок. со стороны админа нужно ...

    Закрыт
    3 года назад
  • Есть такая CRM - frontpad ([url=http://frontpad.ru/]http://frontpad.ru/[/url]), у них есть своё апи ([url=https://docs.google.com/document/d/1gs81CYvJ6FD9KOseL3GOcrcR2YnEvjQqJn9mJRRc5Yk/edit?usp=sharing]https://docs.google.com/document/d/1gs81CYvJ6FD9KOseL3GOcrcR2YnEvjQqJn9mJRRc5Yk/edit?usp=sharing[/url]) для получения данных например из интернет магазина. У нас есть интернет магазин на вордпресс+вукомерс. Нужно научить меня как сделать интеграцию данного апи ...

    Закрыт
    3 года назад
  • $100

    Добрый день! Нужен человек который сможет доработать бота в BlueSales. Скорее всего, нужно будет изучить логику работы ботов в сервиса и доработать его. Там смысл такой, что создается json файл, который хранит в себе всю логику.  Документация и ...

    Закрыт
    3 года назад
  • Модуль запрашивает  по апи на каждое обновление в корзине весь список пунктов, что приводит к чрезмерному трафу и торможению формы. Надо эти пункты 1 раз в день класть в таблицу, а остальные разы из нее ...

    Закрыт
    3 года назад