Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Требуется сделать PHP cкрипт для поиска релевантных текстов к заданному тексту.

Поиск должен выполняться максимально быстро.

Рассмотрим также альтернативные против PHP решения.

Имеется примерно 450.000 текстов на различных языках, из различных блогов, в кодировке UTF8, каждый текст в среднем 1000 знаков.

Поиск релевантных текстов к заданному тексту должен выполняться в пределах каждого из языков по отдельности.

Например: 

взяли текст на английском языке, и под него ищем релевантные тексты также на английском языке;

взяли текст на итальянском языке, и под него ищем релевантные тексты также на итальянском языке;

...

и т.д.

Как выглядят тексты, среди которых нужно проводить поиск?

Наши парсеры собирают тексты по всему Интернету и на всех языках. Перед сохранением в базу каждый текст очищается от "мусора", и если "после очистки" длина текста превышает 500 знаков, то такой текст заносится в нашу базу, основаную на mongodb. Под "мусором" понимается всё, что не является простым текстом (стили, картинки, хтмл-тэги и т.д.).

Чтобы увидеть такой текст, откройте любой сайт блога или любой новоствной портал, и взгляните на текст полной новости.

Все тексты сохранены в mongodb базе данных.

Нет ограничений по оборудованию.

Если это необходимо, то можно прибегнуть к помощи сторонних программ/скриптов/приложений, если Вы опишите такую необходимость.

Ваше предложение будет принято, если Вы не только предложите свой разумный концепт/метод поиска, но также сможете его реализовать на практике.

Оплата сдельная, договорная.

Дальнейшая информация через скайп.

Ник скайп'а в профиле.

7 лет назад
sabia
Антон 
42 годаУкраина
18 лет в сервисе
Был
15 дней назад
  • Похожие заказы
  • $35

    Необходимо написать простой веб-интерфейс. Внешний вид интерфейса - простейшая форма: - поле ввода и кнопка "найти". В поле ввода клиент заносит название города и в результате поиска получает список пунктов самовывоза в этом городе (если они есть), либо ...

    Закрыт
    8 лет назад
  • интернет-магазин китайского чая shopchai.ru расширяется до нового региона (Архангельская область). Для этого был создан поддомен severodvinsk.shopchai.ru   Именно на этот поддомен необходимо настроить географическую привязку. А именно:  - Все те, кто географически находятся в Архангельской области, при ...

    Закрыт
    8 лет назад
  • Нужен скрипт, после клика посетителя в любой области сайта вебмастера, фокус переносится на сайт рекламодателя, а исконный сайт вебмастера остаётся фоном в другой вкладке.  Как здесь light blind https://visitweb.com/blog/wp-content/uploads/2014/11/blind_light-blind-3.png

    Закрыт
    8 лет назад
  • $5

    На сайте test5.vsemesta.net нужно сделать возможность вывода выпадающего подменю, вот как тут: tsem.by один в один, должно корректно работать во всех разрешениях. Бюджет 5 wmz плюс хороший отзыв, оплата по факту, пишите кому интересно.

    Завершен
    8 лет назад
  • $5

    Есть страница: index.html?links.htm Надо прописать редирект 301, но простой вариант: Redirect 301 /index.html?links.htm http://страница куда редиректить из-за знака вопроса в УРЛе не работает. В Интернете нашли вроде такой вариант: RewriteCond %{QUERY_STRING} ^links.htm$ RewriteRule ^index\.html$ http://страница куда редиректить [L,R=301] но тоже не работает. Нужен ...

    Закрыт
    8 лет назад
  • Нужна программа бот, которая бы имитровала действия человека и ставила ставки на основании сканера (surebet.com, allbestbets). Нужна максимальная степень автоматизации - сама открывает одновременно страницы с событиями у букеров, сама находит исход, вводит цифру и ...

    Закрыт
    8 лет назад
  • Добрый день! необходимо доделать сайт. нужен программист php со знаем вордпресса. Необходимо доделать: -функционал акции – не шаблонный модуль -доверстать страницы. подробности в переписке работаю только по пост оплате.

    Закрыт
    8 лет назад