Обработка отсканированного текста в html

Артем16 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
21.12.2009

Имеется статья, состоящая из примерно 50 страниц. Есть скан в jpg и более-менее распознанный текст. На каждой странице есть большая фотография (на пол страницы) и текст. Некоторые страницы - просто одна большая фотография.

Задача: проверить правильность распознанного текста, исправить неточности, перенести текст в html-файл заданного образца и вырезать все фотографии в отдельные jpg файлы с определенным разрешением.

Образец исходника - в приложении.

Сроки не сильно критичны.

В ближайших планах еще около 30 подобных статей/работ.

Заявки фрилансеров