Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Есть кусок кода на перле.

Необходимо переписать две функции – wcomb и mkdict

Остальные функции не несут смысловой нагрузки.

В целом, данный скрипт выдран из бОльшего скрипта. Он предназначен для парсинга текста, и делает из него словарь.

Функцию парсинга текста get_text я вырезал за ненадобностью, т.к. текст будет браться либо из локального файла, либо закачиваться с компьютера.

Функция form_sents, видимо, убирает лишние символы.

Функция wcomb собирает из текста словосочетания из двух слов, если в тексте они встречаются N-ное кол-во раз, и помещает в файл WC. (wc_bwords.cfg – это, похоже, список стоп-слов)

Функция mkdict, собстственно, создает словарь. Вначале выполняется внешняя программа tagger, и сохраняет в файл с расширением «.tagg». Из созданного tag-файла парсятся части речи и складываются в соответствующие файлы: RB NN NNS VB VBN VBG JJ JJR. В заключение, на основе этих файлов и tagg-файла создаются так называемые темплейты.

Примеры файлов находятся в аттаче в папке dict.

Данный скрипт надо переписать и оформить в работающий скрипт на PHP или Python (Perl не желателен, предпочтителен PHP). Программа tagger будет находиться физически на том же сервере. Скрипт должен иметь простейший интерфейс, посредством которого можно будет указать путь до tagger’а, откуда брать текст (локальный файл, с компьютера или http), название созданного словаря (папка, в которой будут файлы, сейчас это dict). По окончании работы скрипта должно быть соответствующее извещение, название словаря, размер (кол-во строк) файлов RB NN NNS VB VBN VBG JJ JJR WC TMPL

Желательно реализовать таким образом, чтобы при закрытии страницы (кроме случая, когда файл в процессе загрузки с компьютера) скрипт продолжал работать.

14 лет назад
LeXs-work
16 лет в сервисе
Был
14 лет назад
  • Похожие заказы
  • Дана матрица X*Y ее элементы частично заполнены некими значениями Надо переставить значение из рандомной n-ной строки в m-ную этого же столбца на свободное место (если место занято, то итерацию повторить с другой строкой), а из m-ной строки ...

    Завершен
    14 лет назад
  • $35

    Нужно сегодня максимально быстро натянуть шаблон на готовый интернет магазин, структура сайта остается практически не изменная, меняется только графика, шаблоне не сложный. Оплата 1000р, Яндекс.Деньги

    Закрыт
    14 лет назад
  • Нужно создать парсер следующего типа : 1. Собирал данные по товарам: код товара , наименование товара , описание товара , цена , фирма- продавец, картинка товара. 2. Запускался с сервера. 3. Своя для него админка 4. Впоследствии сделать ...

    Закрыт
    14 лет назад
  • $500

    Добрый день, Есть работа для PHP программиста в Санкт-Петербурге. Задача - доработка 2х порталов. Проект интересный и динамичный. От вас необходим опыт работы и способность разобраться в коде. Оплата сдельная, 1500 рублей рабочий день, работа возможно как ...

    Закрыт
    14 лет назад
  • 1.Позволить восстанавливать пароль автору без указания секретного вопроса. Коментами указать в скрипте «старый вариант» дабы к нему в будущем вернуться . (В настоящий момент предусмотрено восстановление пароля только при указании ответа на секретный вопрос.) 2. Указать ...

    Завершен
    14 лет назад
  • $1000

    Тз в приложении пишите цену без дизайна и без лицензии можете только написать какая лицензия понадобится и почем битрикс ее продает в общем покажите примеры работ на битриксе а также напишите цену с меня покупка лицензии и дизайн в псд

    Закрыт
    14 лет назад