Фрилансеры предложат решение вашей задачи уже через несколько минут!

Публикация заказа на фриланс бирже не займет много времени.

8 лет назад
Сергей Ф.
Сергей Ф. 
39 лет, Россия
11 лет в сервисе
Был онлайн 7 лет назад
8 лет назад

Итак, на входе 2 csv файла с нным кол-вом столбцов, разделенные запятыми или точка с запятой,
1 input file — основной
2 input file — дополнительный
Программа берет поочередно, сначала первую фразу из 1 input file из столбца PhraseYD и плюс к ней ВЕСЬ набор фраз из 2 input file. Проверяет на морфологическое совпадение (слова, слову, словам). Если все остальные из 2 input file определены как морфологические дубли, то они помечаются как Yes в столбце csv DoubleYD, потом отправляет так же следующую фразу из 1 input file. И так далее.
Это функция поиска дублей между 2мя файлами. Вторая функция — поиск дублей внутри одного файла по этому же принципу, первая фраза сравнивается с последующими, потом вторая фраза с последующими.
Объем большой, скорость важна.

Нужно использовать морфологию Яндекс mystem http://company.yandex.ru/technologies/mystem

Плюс должен быть файл с минус словами в папке со программой, будет подгружаться при загрузке.

  1. Прием заявок
  2. Выбор исполнителя
  3. Выполнение заказа
  4. Обмен отзывами
Выбранный исполнитель
Дмитрий Петелин
47 лет, Украина
12 лет в сервисе
Был онлайн 1 час назад
8 лет назад

$20

1 день

Дмитрий Петелин
47 лет, Украина
12 лет в сервисе
Был онлайн 1 час назад
8 лет назад
Игорь Гуч
31 год, Беларусь
11 лет в сервисе
Был онлайн 5 лет назад
8 лет назад

Другие заказы в категории «Веб-программирование»

Здесь заказчик и фрилансеры могут обсуждать заказ до начала его выполнения.
Фрилансеры могут участвовать в обсуждении только после подачи заявки.
Здесь заказчик будет контролировать выполнение заказа и общаться с исполнителем.
Доступ к этому разделу имеют только заказчик и выбранный исполнитель.
Все материалы этого раздела закрыты от поисковых систем.