Парсер выборочной информации - данные в таблицу
Есть ссылка типа:
http://www.hm.com/de/product/17610?article=17610-D#shopOrigin=SA
Необходимо создать «парсер-форму» (программу), которая при «вставке» данного типа ссылки, парсила бы страницу и разносила информацию в Exsel.
Т.е. вставил одновременно 10, 20 или 30 ссылок такого типа с сайта и получил 1 файл табличной формы.
Какая информация меня интересует:
Ссылка (на страницу) = http://www.hm.com/de/product/17610?article=17610-D#shopOrigin=SA
Наименование = Wattiertes Bügel-Bikinitop
Описание = всё что после BESCHREIBUNG =
Bikinitop mit dekorativem Wickeldetail vorn. Modell mit vorgeformten, leicht wattierten Bügelcups, die den Busen anheben und formen. Breite Bindebänder im Nacken und auf dem Rücken. (Größe 75 E und 80 E haben Verschluss mit Metallschließe im Rücken.)
Тип = DETAILS только это = 8% Elasthan, 92% Polyamid
Цвет = FARBE:= Schwarz, Blau, Dunkelblau, Rot, Grau, Beige(через запятую и пробел)
Размер = 75A, 80A, 75B, 80B, 85B, 75C, 80C, 85C, 75D, 80D, 85D, 75E, 80E(через запятую и пробел)
Цена = …
Картинка = ***.jpg
Между картинками ставим знак |||
Если пройти по ссылке то можно заметить, что один и тот же товар имеет несколько цен.
Это связано с тем, что на некоторые цвета объявлена скидка.
Так вот, там где цена одинаковая это одна строка, там, где цена другая, новая строка.
Необходимо сделать замену символов Ä = A, ä = a, Ö = O, ö = o, ß = s, Ü = U, ü= u, ê = e
В итоге смотрим Exsel файл, что должно получится.
П.С.
Всё обсуждаемо... если есть вопросы...
Если нет, то от Вас.
1. Всё что заявлено - выполню.
2. Сделаю ..... (дата или срок)
3. Руб, вмз, яды... варианты...
если всё ок, то есть другие сайты к котором тоже нужен будет свой парсер на основе этого (4 штуки... 3 из них намного проще)
И ещё... если не сложно...
хотя бы примерно опишите в ЛС как Вы видите ВСЁ ЭТО...
в двух, трех словах... ну т.е. например:
окно, вставил ссылки, указал путь к сохр., нажал на кнопку и...