Несложный парсер на php
ОБЩЕЕ ОПИСАНИЕ
Скрипт должен вытащить со страницы http://www.phonearena.com/htmls/phones.php урлы заданных производителей, пройтись по ним и по соотв. подстраницам и вытащить описания всех телефонов.
ВХОДНЫЕ ДАННЫЕ
1) url: http://www.phonearena.com/htmls/phones.php
2) Список производителей. Для теста пусть это будут Nokia, Sony Ericsson, RIM BlackBerry.
РЕЗУЛЬТАТ
1) xml-файл - со всей информацией по телефону: Published, Description, Market Status и все поля из таблицы Specifications.
2) php-cкрипт который парсит итоговый xml и формирует html-страничку с данными. Форматирование предельно простое. Скрипт по сути тестовый.
ЗАМЕЧАНИЯ
1) Страница каждого производителя телефонов есть в разных вариантах. Парсить ту, что "All phones". Она же является страницей по умолчанию.
2) Страница каждого телефона есть в разных вариантах. Парсить ту, что "Intermediate". Она же является страницей по умолчанию.
3) Скрипт должен быть написан на php. Используемые библиотеки - по вашему усмотрению.