Поправить текстовые документы
Чисто автоматическая работа буквально на пару часов, для тех кто быстро нажимает на клавиши.
Имеются описания товаров (которые были в *.doc, теперь сконвертированы в *.fb2 - разновидность XML). Файлы в fb2 практически готовы для импорта, но их формат сложен для парсера и нужно вручную их доработать.
Вот последовательность действий, которую надо сделать с каждым fb2-документом:
1. Убрать в начале каждого документа.
2. Убрать пустые строки (необязательное действие, но так удобнее).
3. Убедиться, что первые четыре
содержат: 1) Латинское название; 2) Транслитерированное название в кириллице; 3) Краткое описание; 4) Код товара. Если п.3 нет, то соответствующий тэг должен быть, но пустой.4. Убрать в конце документа всё, что после строки "Поскольку на условия и способ использования...." вместе с тэгами. Однако закрывающий должен остаться.
5. Самая ответственная часть: необходимо расставить свойства товара в правильном порядке (всё, что после "Теоретический расход в один слой м2/л" и до конца документа). После каждого свойства должно идти его значение, записанное в одну строку (в одном тэге
). Для того, чтобы понять - какому свойству какое значение соответствует, для справки я приложил первоначальный DOC к каждому FB2.). Свойства и значения разбросаны, но не случайным образом - в некоторых документах они уже выстроены как надо, а в некоторых - разнесены по строкам с периодом в 4 строки.
Для удобства понимания того, что тут написано, я приложил 4 уже поправленных файла.
На выходе должно получиться 67 штук поправленных FB2-файлов. Работа несложная, но срочная, а имеющихся рук не хватает.
Файлы тут: http://files.mail.ru/66ONXH