Скрипт для парсера
Второй скрипт. Для второго сайта. http://www.c-and-a.com/de/
Необходимо создать «парсер-форму» (программу), которая при «вставке» данного типа ссылки, парсила бы страницу и разносила информацию в Exsel.
Т.е. вставил одновременно 10, 20 или 30 ссылок такого типа с сайта и получил 1 файл табличной формы.
Какая информация меня интересует:
Ссылка (на страницу) =
Наименование = Wattiertes Bü gel-Bikinitop
Описание = всё что после BESCHREIBUNG =
Bikinitop mit dekorativem Wickeldetail vorn. Modell mit vorgeformten, leicht wattierten Bü gelcups, die den Busen anheben und formen. Breite Bindebä nder im Nacken und auf dem Rü cken. (Größ e 75 E und 80 E haben Verschluss mit Metallschließ e im Rü cken.)
Тип = DETAILS только это = 8% Elasthan, 92% Polyamid
Цвет = FARBE:= Schwarz, Blau, Dunkelblau, Rot, Grau, Beige (через запятую и пробел)
Размер = 75A, 80A, 75B, 80B, 85B, 75C, 80C, 85C, 75D, 80D, 85D, 75E, 80E (через запятую и пробел)
Цена = …
Картинка = ***.jpg
Между картинками ставим знак |||
Если пройти по ссылке то можно заметить, что один и тот же товар имеет несколько цен.
Это связано с тем, что на некоторые цвета объявлена скидка.
Так вот, там где цена одинаковая это одна строка, там, где цена другая, новая строка.
Необходимо сделать замену символов Ä = A, ä = a, Ö = O, ö = o, ß = s, Ü = U, ü= u, ê = e
В итоге должен получится Exsel файл.