Извлечь данные заданного типа из файла IDML

Алексей17 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
19.05.2020

Есть ряд файлов в формате IDML (Adobe InDesign file format). По сути это запакованный в zip набор xml-файлов (по аналогии с DOCX, XLSX и т.п.).

Нужно разработать скрипт-функцию на PHP, который будет находить в этом файле все номера артиклей товаров, которые выделены особым стилем (конкретное значение attr у ноды XML) и сохранять их в текстовый файл с номерами страниц.

Пример такой ноды

https://e-wm.org/i/E20200519-175241-001.png

надо извлечь "4 020 024". Номер страницы придётся вычислить по структуре файла.

У этого файла есть PDF-представление, вышлю, если нужно.

Пример файла находится в аттаче - если работали с подобными файлами, для вас не будет проблемой.

Заявки фрилансеров