Распознать и отредактировать 110 страниц сканов
Нужно распознать с фотографий оглавления книг для книжного интернет-магазина. Вы получите 167 фотографий - обложки книг и их оглавления. Распознавать нужно только оглавления, около 110 страниц.
Выполненную работу сдадите в текстовом файле MS Word следующего вида:
[Название книги]
Ее оглавление, которое вы распознали и тщательно вычитали
[Название следуюей книги]
Ее оглавление, которое вы распознали и тщательно вычитали, и т. д.
Оглавления нужно немного отформатировать. Если в оглавлении встречается "Глава такая-то" или "Часть такая-то" и дальше ее название, то нужно привести это к виду "Глава такая-то"[точка][пробел]Ее название.
Нужно убрать все номера страниц и многоточия.
В файле, который вы сдадите, сохраняйте частично форматирование исходного текста - то, что на картинках выделено жирным шрифтом или курсивом.
Тексты на русском и украинском языке.
Такой работы у меня очень много, 1-2 тыс картинок в месяц. Один постоянный исполнитель уже есть, но он перегружен, нужен еще один человек. Если по этому проекту будет все ОК, то дальше будут от меня еще такие заказы.