Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Необходимо сконвертировать slovesa.ru в словарь формата ABBYY Lingvo

вот такую к примеру страницу

http://slovesa.ru/assearch?q=%D8%D2%C0%CD%C8%D8%CA%C8

необходимо привести к такому виду:

ШТАНИШКИ

[m] Ассоциации со словом «ШТАНИШКИ» [m]«ШТАНИШКИ» связано с: [m]ПОЕЗДКА КЛИНЫШЕК ЛОДЫЖКА ГИПОТЕЗА [m] ШТАНИШКИ бывает: [m] КОРОТКИЙ ПОЛОСАТЫЙ ТЕМНО-СЕРЫЙ НАРЯДНЫЙ ЗИМНИЙ КОРОТЕНЬКИЙ СЕРЕНЬКИЙ УЗКИЙ БАРХАТНЫЙ НОВЫЙ ЗЛОСЧАСТНЫЙ КРОШЕЧНЫЙ ОЧЕРЕДНОЙ КАЗЕННЫЙ ТЕСНЫЙ ГУМАННЫЙ РОЗОВЫЙ ТЕМНО-СИНИЙ ВЯЗАНЫЙ [m] ШТАНИШКИ может(но): [m]СНЯТЬ ПИСАТЬ НАДЕТЬ ИСЧЕЗНУТЬ [m] Раскраска [m] Розовый Темно-серый Темно-синий [m] Масштабность»[m] Крошечный

То есть значимую информацию с КАЖДОЙ из страниц сайта (пройдясь по индексу слов) нужно вынуть и слить в этих тегах в ОДИН текстовый файл.

Желательно, чтобы каждое из словарных слов (ПОЕЗДКА КЛИНЫШЕК ЛОДЫЖКА ГИПОТЕЗА итд) было заключено в тег [ref]

Ту же операцию необходимо произвести с сайтом wordassociations.ru (лучше даже начать с него, так как он полнее)

В двух словах, в dsl заглавное словарное слово начинается с новой строки, тело карточки с новой строки и табуляции, [m] – перевод строки, а – полужир. Подробней о dsl (языке словарей Lingvo) здесь:

http://lingvo.helpmax.net/ru/%D0%B2%D0%BE%D0%BF%D1%80%D0%BE%D1%81%D1%8B-%D0%B8-%D0%B7%D0%B0%D1%82%D1%80%D1%83%D0%B4%D0%BD%D0%B5%D0%BD%D0%B8%D1%8F/dsl-compiler/

также перед преобразованием в формат dsl из словарных статей необходимо вычистить символы [ , ], #, @,

вместо них можно использовать: (,), {,}

спасибо.

андрей

12 лет назад
andreydat
Андрей 
46 летУкраина
13 лет в сервисе
Был
6 лет назад
Выбранный исполнитель
Korvin
Сергей 
48 летУкраина
19 лет в сервисе
Был
5 месяцев назад
12 лет назад
$100
5 дней
Сотрудничество не состоялось по независящим от пользователя причинам.
Хороший заказчик