Сканирование статей из журнала
Нужно просканировать журналы и извлечь из них статьи в формат .doc удалив все ошибки сканирования и переносы слов присутствующие в журнальной публикации. Качество сканирования журналов программой ABBYY Fine Reader которую я рекомендую очень высокое поэтому работы с статьей минимум. Указывайте стоимость работы. Для примера скидую похожий журнал
1. Создаем папку с произвольным названием в которой будут храниться работы по проекту.
2. Создаем в этой папке еще одну с номером и годом выпуска журнала, например "02-2013"
3. Сканируем журнал программой ABBYY FineReader
4. Выбираем из просканированого документа статьи. Создаем документ Ворд из названием статьи
5. В сам файл вносим заголовок статьи и основную текстовую часть без рисунков, таблиц, схем и прочего. Ненужно вносить авторов, название рисунков и т.д и т.п. Только заголовок и основной текст.
6. В получившемся файле удаляем все ошибки сканирования, переносы слов и т.п. Сохраняем только логическую структкру статьи, тоесть абзацы и списки.
Действия 4-6 повторяем со всеми статьями в журнале. Журналов много.