Извлечь данные заданного типа из файла IDML
Алексей17 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
19.05.2020
Есть ряд файлов в формате IDML (Adobe InDesign file format). По сути это запакованный в zip набор xml-файлов (по аналогии с DOCX, XLSX и т.п.).
Нужно разработать скрипт-функцию на PHP, который будет находить в этом файле все номера артиклей товаров, которые выделены особым стилем (конкретное значение attr у ноды XML) и сохранять их в текстовый файл с номерами страниц.
Пример такой ноды
https://e-wm.org/i/E20200519-175241-001.png
надо извлечь "4 020 024". Номер страницы придётся вычислить по структуре файла.
У этого файла есть PDF-представление, вышлю, если нужно.
Пример файла находится в аттаче - если работали с подобными файлами, для вас не будет проблемой.