Скрипт php
Необходимо сконвертировать http://www.reright.ru/ в словарь формата .dsl (для ABBYY Lingvo)
вот такую к примеру страницу
http://www.reright.ru/analysis/?word=690537
необходимо привести к такому виду:
xотение
Хотение бывает:
[c]всяким глубочайшем умозрительным собственным истинным неудержимым своевольным простым деятельным [/c]
Хотение может (можно):
Данные, связанные с этим словом пока не обнаружены.
Ассоциации к слову «Хотение»:
[c]париж действительность мысль возможность[/c]
Синонимы слова «Хотение»:
[c]алчность вожделение воля готовность жажда желание зуд нетерпение охота похоть[/c]
То есть значимую информацию с КАЖДОЙ из страниц сайта в разделе "Анализ слова" (пройдясь по индексу слов) нужно вынуть и слить в этих тегах в ОДИН текстовый файл.
В двух словах, в dsl заглавное словарное слово начинается с новой строки, тело карточки с новой строки и ТАБУЛЯЦИИ (здесь на сайте не отражается, но все строки кроме заглавной (заглавное слово со строчной буквы) должны быть с отступом), тэги – полужир (для слов "бывает", "может (можно)", "Ассоциации", "Синонимы" и собственно словарных слов), - курсив (для фраз типа "Данные, связанные с этим словом пока не обнаружены."), а [c] - цвет.
Подробней о dsl (языке словарей Lingvo) здесь:
http://lingvo.helpmax.net/ru/вопросы-и-затруднения/dsl-compiler/
также перед преобразованием в формат dsl из словарных статей необходимо вычистить символы [ , ], #, @,
вместо них можно использовать: (,), {,}
спасибо.
андрей