Преобразование сканов технического текста
Необходимо выполнить фильтрацию распознанного текста с помощью программы ClearFineReader (см. видео http://www.youtube.com/watch?v=KGNQIGht-X0).
Требования к набору следующие:
1. Все математические символы и выражения в тексте заменять тегом
2. Все формулы, записанные в отдельной строкой – тегом
3. Все рисунки — тегом
4. Удалять все пустые строки (убираются автоматически программой ClearFineReader)
5. Удалять переносы слов.
6. Если идут два подряд и более тегов (после автоматической фильтрации в программе ClearFineReader), то оставлять только один.
7. Если предложения разрываются рисунками или переносятся на другую страницу, то корректировать предложение так, чтобы таких разрывов не было.
8. Все формулы и рисунки выделять областями на изображении сканов (делается в программе ClearFineReader).
9. Ошибочно отфильтрованные слова восстанавливать (автоматизировано в ClearFineReader)
10. Заголовки параграфов выделять не нужно.
Книгу для преобразования (фильтрации) можно скачать по ссылке https://yadi.sk/d/H-hSHIMIeVjdq
Программа ClearFineReader будет передана выбранному исполнителю.
Оплата работы через WebMoney.
P.S. Скорость преобразования текста с помощью программы ClearFineReader составляет 30–50 страниц в час (в зависимости от сложности). Ищу ответственного исполнителя для этой работы.