Макрос excel и грабер сайта 2 в 1

Веринов11 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
02.01.2014

EXCEL МАКРОС

1. Сравнивается "первый" и "второй" excel файл, все сравнения ведутся по первому столбцу. Если в первом столбце есть что-то кроме цифр то строка игнорируется.

2.В каждой строке первого столбца есть конкретный номер, каждый такой номер из первого файла ищется во втором если номер есть и в первом и во втором файле то он не учитывается, если же какой-то из номеров есть одном файле но нет во втором то он прибавляется к тексту http://www.microtron.ua/goods#p и эта ссылка помещается с новой строки в текстовый файл "№1"

3. Если в четвертом столбце первого файла найдены фразы имеющие в своем составе "Ожид" то номер первого столбца этой строки также прибавляется к тексту http://www.microtron.ua/goods#p и эта ссылка помещается с новой строки в текстовый файл "№1"

4. Убрать дубликаты ссылок из текстового файла №1

ГРАБИНГ

5. Грабятся ссылки из текстового файла №1

6. Грабятся в режиме входа пользователя, должна быть возможность указать логин и пароль для входа или куки.

6. Грабится следующая структура на примере http://www.microtron.ua/goods#p41403 (пример результата после двоеточий, в начале строк столбцы в которые необходимо поместить сграбленные данные, пример файла во вложении)

_CATEGORY_ Категория размещения, без главной категории с заменой разделителя на "|": ТВ, аудио, видео и фото|HD Медиаплееры|Asus

_NAME_ Наименование: Медиаплеер HD ASUS O!Play MINI HDMI, USB, Cardreader

_MANUFACTURER_ Производитель, а при его отсутствии вставляется фраза "Неизвестен": ASUS

_SKU_ Код товара:41403

_UPC_ Гарантия производителя: 12 мес.

_PRICE_ Цена+ процент, должна быть возможность указать процент, на примере +10%:734.80

_STOCK_STATUS_ID_ Наличие товара, может иметь следующие варианты

"товар есть в наличии" http://www.microtron.ua/goods#p41403 переименовать в "5"

"ожидается поступление..." http://www.microtron.ua/goods#p93868 переименовать в "6"

"товар доступен под заказ" http://www.microtron.ua/goods#p61885 переименовать в "7"

"нет в наличии, уточняйте доступность у менеджера" http://www.microtron.ua/goods#p37801 переименовать в "8". В случае этого варианта цена товара выставляется в ноль: 5

_DESCRIPTION_ Характеристики в виде html:

...

_IMAGE_ Большое изображение товара сохраняется в отдельную папку с сохранение оригинального имени, в файл куда производится грабинг копируется измененное местоположение файла : data/pictures/picorig_41403_1300046695.jpg

_ID_ в этот столбец заносится код товара

_MODEL_ в этот столбец вставляется фраза "нет"

_LOCATION_ в этот столбец вставляется фраза "Запорожье"

_QUANTITY_ в этот столбец вставляется число "99" при наличии товара "товар есть в наличии" или число "0" во всех остальных случаях

_HTML_TITLE_ в этот столбец вставляется наименование товара

_HTML_H1_ в этот столбец вставляется наименование товара

_STATUS_ в этот столбец вставляется число "1"

Пример стуктуры выходного файла во вложении

Примерный размер excel файлов около 18000 строк, это необходимо учитывать при оптимизации времени работы скрипта