Парсер сайтов на PHP
Нужно сделать парсер сайтов сделаных на конструкторе STDsite. Он должен парсить только каталог товаров и на выходе выдавать файл в формате CSV и папку с изображениями.
В файл должны попадать:
- название товара
- краткое описание товара
- полное описание товара
- фоторгафия (должна сохраняться 3 раза под уникальными названиями)
- цена
- title
- keywords
- description
(пример CSV файла пришлю по просьбе)
скрип должен сам обходить весь сайт с помощью регулярного выражения находить страницы сообветствующие шаблону страныцы карточки товара (например http://www.termoresurs.ru/7279362558/1203694142581) и с нее забрать нужные фрагменты. очищать фрагменты от лишних тегов форматирования и спецсимволов.
примеры сайтов сделаных на конструкторе (для тестов):