Спарсить контент в CSV
http://www.vse-kraski.ru/catalog.html
С этой странички надо спарсить товары (для каждого: название, производитель, категория, контент, цена).
Далее надо чуть подчистить контент: в большинстве позиций (например: http://www.vse-kraski.ru/gr/35/2~2823/emal_pf-115_sero-golubaya_491_492.html) вначале контента идёт таблица с номенклатурой и ценой - её надо вырезать. А то, что после неё - оставить (Во многих позициях в итоге останется пустота).
Опционально: в некоторых позициях (например: http://www.vse-kraski.ru/gr/35/7~2793/kraska_ma-15_bezhevaya.html ) характеристики товара представлены не в виде таблицы, а в виде работы секретарши, признающей в качестве инструмента форматирования только пробел. Можно ли как-то автоматизированно эту порнографию конвертировать в таблицу?
На выходе нужен CSV с каким-нибудь сепаратором, типа "||". CSV потом будет импортироваться в друпал, если что.
Нужно сделать за выходные.