Парсинг сайта orangetao в БД
Нужно написать граббер товаров с orangetao.ru для дальнейшего использования на сайте-агрегаторе.
Требуется:
- просканировать все каталоги, подкаталоги, каталоги других уровней
- сохранить родительскую директорию в БД
Пример парсинга http://orangetao.com/ru/p/3947899786/ прикреплен к описанию проекта
Финальный результат будет следующим:
- скрипт, который будет грабить сайт orangetao на наличине новых товаров.
- будет проходить проверка артикула товара (ключеное поле, обязательно к парсингу)
- картинки товара будут сохраняться в папку, название которой соотвествует артикулу
- данные по другим товарам продавца, товарному описанию будут загружены в БД
Предусмотреть переход скрипта по другим страницам навигации (1,2,3..700..) а автоматическом режиме.
Ваши предложения готов обсудить в скайпе.