Нужно сделать парсер
С сайта поставщика данные о товарах выгружаются в следующем виде:
Это архив, внутри которого папки. Имя каждой папки это артикул товара. Внутри каждой такой папки находятся еще два файла: 1. Текстовый файл с именем как и у папки (артикулом товара) и 2 . - файл *.jpg (фото товара) имя которого начинается с артикула товара, а за ним следуют рандомные значения.
Необходимо:
Отпарсить каталог с папками и вложенными (текст и фото) файлами так чтобы :
1. Имя текстового файла добавилось в файл *.csv в колонку “product_sku” и “product_name”.
2. Текст внутри текстового файла (характеристики товара) добавился в тот же *.csv файл в колонку “product_s_desc” на соответствующую артикулу (колонку “product_sku”) строку.
3. Имя файла с фото добавилось в тот же *.csv файл в колонку “file_url” после значения images/stories/virtuemart/product чтобы получилось, например - images/stories/virtuemart/product/cs194_1.jp
4. В файле *.csv также содержится колонки “custom_title” и “custom_value”. Колонка “custom_title” указывает на название настраиваемых полей и имеет одно значение для всех строк внутри одного такого *.csv файла. А колонка “custom_value” указывает на конкретные значения настраиваемых полей и так как файл *.csv отдельный для каждой категории товаров по материалу (например – satin.csv) то значение с материалом также не меняется для всех строк внутри *.csv файла. А для остальных значений (пример - сатин|1.5 спальное|||160x210|70X70 (2шт)|180x245), начиная со второго значение – 1.5 спальное необходимо установить правило формирования. К примеру: второе значение (1.5 спальное) зависит от 3-го значения (160x210). Если первая цифра 3-го значения 150-160 то второе значение в колонке будет – 1.5 спальный. В случае если первая цифра 3-го значение 180-200, то второе значение – 2-х спальный. Также если 200-235 – Евро. И так еще 1-2 значения.
Пример файла satin.csv/стуктура каталога/само тз во вложении.