Доработка системы приема заказов в бюро переводов
Захар14 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
16.01.2011
1. Система должна получать от клиента и обрабатывать документы не только в формате .txt, но и в форматах других распространенных текстовых и графических редакторов: .doc, .docx, .odf, .rtf, .html, .xhtml, .sml, .oeb, .DjVu, .chm, .xps, .ppt, .pptx, .xls, .xlsx, .pdf, .cgm, .bmp, .ecw, .gif, .jpeg, .pcx, .png, .psd, .tga, .tiff, dwf и т.д.
Затем идет подсчет слов системой. Отличия от нынешнего состояния:
А. голые цифры (без спецсимволов в пределах трех слов до и после) надо исключить из подсчета.
Б. Надо проверить адекватность подсчета слов в текстах на кириллических, латинских, арабских, восточных языках, включая иероглифические.