Редактирование и корректировка документов
Необходимо восстановить статьи, сконвертированные pdf -> doc.
В исходных документах журнальная верстка (см. порезанный пример во вложении). В каждом таком документе (всего исходных документов около 40) примерно 2-3 больших статьи (по 6-8К символов) и 3-4 мелких (до 1000 знаков). Необходимо статьи собрать в обычный plain text (одна статья - один txt файл).
Прошу не пугаться примера во вложении. Качество исходных материалов выше, чем у примера. Чтобы пролезть в лимит веблансера на размер присоединяемого файла, пришлось убрать из файла все графические вставки, из-за чего пострадала читабельность. В "настоящем" файле для работы принадлежность текста той или иной статье вопросов не вызывает в принципе.
Как видно, тексты потребуют легкой корректировки: убрать ненужные переносы, убрать разрывы между словами, добавить дефис и т.п. Рерайт НЕ требуется.