Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Необходимо реализовать на C# алгоритм сравнения текстов (алгоритм шинглов).

Описание алгоритма:

http://habrahabr.ru/post/65944/

http://blog.arseo.ru/shingly/

http://uniofweb.ru/wiki/algoritm-shinglov/

http://www.codeisart.ru/part-1-shingles-algorithm-for-web-documents/

http://www.codeisart.ru/python-shingles-algorithm/

Есть система управления рерайтерами (ASP.NET C# /SQL Server), в которую 100 рерайтеров постоянно добавляют свои статьи. При добавлении новой статьи в БД, необходимо вычислить процент схожести добавляемого текста с уже существующими текстами по методу шинглов, чтобы рерайтер видел уникальность добавляемой статьи относительно своих и чужих(ранее добавленных статей). Т.е проверка статей на уникальность осуществляется ТОЛЬКО в рамках нашей локальной БД.

1. Нужна функция на c# (static string GenShingle (string paramText, int paramShingleLen)), которая получив в качестве параметра текст и длину шингла, вернет 100(или 50) шинглов(через запятую). Если решите хранить данные в поле XML, а не через запятую, то можно и так.

2. Нужна Scalar_Function на T-SQL, которая получив два параметра (строку шинглов1 и строку шинглов2) вернет процент схожести текстов. Мы самостоятельно напишем курсор, который «пробежит» все записи нашей БД и найдет минимальный процент схожести для добавляемой в БД записи.

Важно сказать, что длинна текстов от 1000 до 10000 знаков, поэтому придется учитывать работу алгоритма шинглов с короткими текстами. Основная длина шингла с которой будем работать равна 3(трем).

От исполнителя мы надеемся получить SQL – скрипт с функцией и c# код с методом GenShingle. Интегрировать все это в свой проект мы будем самостоятельно. Следовательно, не имеет абсолютно никакого значения ни версия SQL , ни версия VSNET. Даже не имеет значения, на чем будете делать тестовое приложение! Думаю, на WinForm будет проще!

Оплата, после проверки (можно по скайп с расшариванием экрана).

11 лет назад
csbalance
Сергей 
50 летМолдова
11 лет в сервисе
Был
11 лет назад
  • Похожие заказы
  • $250

    Сайт будет текстовый, но со структурой интернет магазина (без возможности сделать заказ). Т.е. сайт рассказывает о продуктах, но заказать можно только по звонку. Нужно определиться с движком сайта, предлгаайте сюда свои варианты. Сразу скажу, что джумлу ...

    Закрыт
    11 лет назад
  • $350

    Требуется парсер сайта auto.ru, сбор номеров телефонов по: 1) маркам 2) моделям 3) году выпуска 4) за один день 5) за два дня 6) за три дня Парсер должен собирать данные в файл Ексель и автоматически посылать новые (свежие добавленные номера) на ...

    Закрыт
    11 лет назад
  • Необходимо создать/адаптировать скрипт/плагин/функцию, которую можно добавить в WordPress. Необходимая функциональность: *есть заданный список RSS потоков (до 10 штук) *скрипт/плагин/функция отбирает из этих RSS материалы, которые содержат в названии (title) заданное ключевое слово/слова *и выводит их примерно в таком виде: ...

    Закрыт
    11 лет назад
  • Нужно сделать парсер, который граббил бы данные из этого каталога http://nnpcto.ru/katalog/ и переносил в каталог на сайте, стоящем на UMI CMS. Структура не нужно, только картинки + описания. Желательно, чтобы парсер потом можно было легко дописать, чтобы он ...

    Завершен
    11 лет назад
  • Требуется специалист для удалённого сотрудничества по работе над интернет-магазинами выполненными на WebAsyst Shop-Script. От кандидатов требуется отличное знание движка и умение программировать. Требуется как написание новых модулей, так и исправление уже готовых. Возможны доработки шаблонов, ...

    Закрыт
    11 лет назад
  • $2500

    Здравствуйте! Необходимо создать сайт (программирование) Заказчик: частное лицо Дизайн сайта - есть Верстка - есть, сайт сверстан HTML+CSS, код валидный Бюджет: до 2000 $ Более подробное ТЗ для ознакомления можно скачать по ссылке После ознакомления с ТЗ необходимо от вас услышать предложение: 1. ...

    Закрыт
    11 лет назад
  • $250

    Здравствуйте! Работа исключительно для программистов со знанием NETCAT. С ссылкой на офф. партнера NETCAT. С отзывами и портфолио рассматриваются в первую очередь. Лохотронщикам с недельными аккаунтами не писать. Описание задания в ТЗ. Возможен торг сайт ...

    Закрыт
    11 лет назад
  • Нужно сделать, чтобы можно было прописать вручную теги title и description для всех категорий и главной на сайте джумлы. Возможно установить плагин для этой цели. Или поставить autogen_metatags_vm1.1.4_v1.7.zip

    Завершен
    11 лет назад