Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Есть такие статьи: https://habrahabr.ru/post/268205/

http://commoncrawl.org/the-data/examples/

Требуется:

1й этап: сделать выборку из главных страниц сайтов на  всех .com, .net, .org, .info  доменах из базы CC, которые содержат определенное регулярное выражение.  

Проверять буду так: уже есть база сайтов, которые содержат нужное выражение. Все мои сайты должны попасть в вашу выборку + в выборке должна быть еще куча таких сайтов. На этом этапе мне нужны только данные.

2й этап: задокументировать вашу систему, так чтобы системный администратор среднего уровня мог по вашим инструкциям заново всё развернуть, настроить нужную регулярку, запустить сбор, получить результат - список сайтов.

Оплата поэтапно, только безопасная сделка, по сделке на этап. Пишите, пожалуйста, цены и сроки.

6 лет назад
Fedor_C
Фёдор 
42 годаРоссия
18 лет в сервисе
Был
3 года назад
  • Похожие заказы
  • Требуется создать программу! Выполняющая следующие действия. 1. Входит на сайт https://mail.google.com/mail/ 2. Водит логин и пароль!        a) Если не работает, или не существует - Выходит оповещение!       b) Если просит номер телефона  - Выходит оповещение!       с) Если входит в ...

    Закрыт
    5 лет назад
  • Добрый день, коллеги!  Необходимо запрограммировать нейронную сеть, сравнивающую два типа объектов по 30 параметрам, с использованием модуля нейронной сети для node.js  Просьба писать ориентировочный срок разработки и Вашу ставку или стоимость работ.

    Закрыт
    6 лет назад
  • Приветствую, нужно частично слизать проект ls.tenebris.cc/index заточенный под соц.сети. (более подробно поясню по ходу дела). Важно, чтобы вы свободно владели темой работы с соц.сетями, а также работали с отпечатками браузера/прокси.

    Закрыт
    6 лет назад
  • Входные параметры: чат в телеграмме в котором периодически появляются новости, перечень ключевых слов (настраивается в отдельном файле/количество слов может незначительно меняться). Требования к программе: в режиме реального времени анализировать поступающие новости по заданным параметрам (по сути ...

    Закрыт
    6 лет назад
  • Есть товарная выгрузка в екселе. Опции, Атрибуты, картинки и тд - разнесены по листам. http://joxi.ru/Vm6L6XMCxWaeaA Проблема: На этих листах отображается только ID Товара, без названия http://joxi.ru/V2V4DXlT0X5bjr В общем немного неудобно все это редактировать. Сам скрипт этой выгрузки както так наворочен ...

    Прикладное ПО1 исполнитель
    Завершен
    6 лет назад
  • Т.З. во вложение. Необходимо разработать Браузер, либо расширение для firefox на подобие tor браузера. Только с нашими пожеланиями  какой либо веб-сервис не подойдет.   Приложение нужно для выкладки обьялений товаров на сайты: Авито, n1 и т.п.   Требуется его ежемесячная ...

    Закрыт
    6 лет назад
  • $1000

    Приветствую, нужен парсер фэйсбук. Задача следующая: Парсер перебирает айди (вида facebook.com/1)  и парсит открытую информацию.  Через хттп запросы. Предположительно, около 10 к потоков. Скорей всего, парсинг в 2 захода. Первым заходом определяем все айди, на которых расположены страницы, на втором ...

    Закрыт
    6 лет назад