Обработка 3000 файлов
Вениамин19 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
15.09.2008
Есть 4 вида файлов - текстовые, RTF и DOC и XLS
Эти тексты содержат телеграммы, в которых имеется следующая информация
1. дата выхода
2. номер или название+раздел документа
3. тема документа
4. ТЕЛО ДОКУМЕНТА
4.1 страны, названия станций, перегонов, портов итд....
4.2 коэффициенты, добавки, скидки итд
4.3 сроки действия, периоды, дата вступления в действие
5. подпись - должность, фамилия
6. указание на связанные документы
7. тип документа (первичный, уточнение, разъяснение, исправление)
Нужно
1. перевести все это в формат XML
2. оформить каждую часть в своих тегах
3. вести учет названий и номеров документов в книге excel с пометкой, какие из них уже есть, а каких - нет
Пример файлов в прикрепленном архиве