Парсер для HTML таблиц
Задача заключается в следующем:
есть сайт Украинской ассоциации банков. На нём выкладывается финансовые показатели (см. http://www.aub.com.ua/ua/2007.html и http://www.aub.com.ua/ua/2007.html?_m=publications&_t=cat&id=304) Финансовые показатели даются в шести таблицах
(
http://www.aub.com.ua/ua/2007.html?_m=publications&_t=rec&id=9033
http://www.aub.com.ua/ua/2007.html?_m=publications&_t=rec&id=9034
http://www.aub.com.ua/ua/2007.html?_m=publications&_t=rec&id=9028
http://www.aub.com.ua/ua/2007.html?_m=publications&_t=rec&id=9029
http://www.aub.com.ua/ua/2007.html?_m=publications&_t=rec&id=9030
http://www.aub.com.ua/ua/2007.html?_m=publications&_t=rec&id=9032
)
Нужен скрипт, который бы парсил эти таблицы и помещал их в БД-шку (таблица БД == таблица на сайте, запись в таблице БД == запись в таблице на сайте, СУБД==MySQL).
Что ВАЖНО: мы хотим чтобы скрипт можно было легко расширять и переделывать поэтому:
1). Скрипт должен быть написан на PHP (желательно PHP 5)
2). Скрипт должен быть выполнен виде класса
3). Скрипт также должен обрабатывать ошибки и исключения которые могут случатся во время работы а также выводить текст о них.
4). Оформление кода должно быть акуратным: с отступами, и снабжено комментариями для всех методов и свойств класса.
МИНИМАЛЬНЫЕ требования к скрипту – извлечь данные из данных сылок и поместить их в базу.
МАКСИМАЛЬНЫЕ требования к скрипту – скрипт должен уметь настраиваться и обрабатывать ЛЮБЫЕ таблицы с любых страниц. Универсальность скрипта, и просто хорошее качество работы будет ПРЕМИРОВАТЬСЯ отдельно.