Распознать и/или набрать текст со сканов
Есть тексты, цифровой вариант которых был утерян.
Надо со сканов перевести это в цифровой вид - вордовские документы формата RTF.
Объем - 20 листов A4.
Из них 16 сканов хорошего качества, 4 - похуже.
Примеры хорошей и плохой страниц - в приаттаченном архиве.
Черные прямоугольники на примерах добавлены специально (тексты не должны разойтись по сети раньше времени).
В документах встречаются рисунки, заголовки, разбивка на колонки и т.п.
Рисунки так и вставляем, текст с них распознавать/набирать не требуется. На колонки не разбиваем, т.е. результирующий текст должен идти единой "простыней". Разбивку на абзацы, разумеется сохраняем. Оформление заголовков (и других элементов текста) сохранять не нужно - достаточно просто выделить вордовским стилем ("Заголовок 1", например).
Исходные файлы - 20 tiff'ов (могу пересохранить в любой другой), разложенные по нескольким папкам. Полученные rtf'ки должны быть так же разложены по папкам. На каждый исходный файл - один новый. Т.е. сливать несколько сканов в один документ не нужно.
Если будете пользоваться софтом для распознавания текста, проследите, чтобы в результате не было латинских букв в середине русского слова и прочих подобных "косяков".
Тексты предназначены для сайта, большая часть их писалась на заказ, поэтому они не должны уйти "налево".
ps. В аьску / почту / приват писать не нужно - просто оставьте заявку к проекту.