Настройка системы машинного перевода Moses
Конечная цель проекта – настроенная система машинного перевода Moses (http://www.statmt.org/moses/). Система уже установлена на образ диска виртуальной машины. Эту систему нужно обучить параллельному корпусу https://translate.yandex.ru/corpus - можно загрузить по ссылке, после заполнения формы, или мы сами можем ее предоставить. Система будет использоваться для перевода строк текста с русского на английский.
http://www.statmt.org/moses/?n=FactoredTraining.HomePage – официальный туториал.
https://ilmoirfan.com/machine-translation-training-statistical-mt-models-using-moses/ - дополнительный туториал
в дополнение к обучению языковой паре, нужно проверить, что неизвестные слова транслитерируются, а не выбрасываются из текста http://www.statmt.org/moses/?n=Advanced.OOVs
доступ к машине можно организовать несколькими способами:
- через ssh
- через клиент windows RDP, внутри которого открыто окно виртуальной машины.
- обмен образами диска через наш ftp сервер. В данный момент машина обслуживается VMware Workstation 14. Возможно конвертирование в образ vdi для VirtualBox