Парсер двух сайтов
Нужен парсер сайтов:
На данный момент интересуют результаты футбольных состязаний, но в будущем понадобятся и многие другие.
Типичный пример страницы:
http://wildstat.ru/p/51/ch/EUR_EL_2011_2012/stg/all/tour/all
На спорт-экспрессе есть несколько типов страниц:
http://football.sport-express.ru/foreign/italy/seriaa/2012-2013/calendar/tours/
http://football.sport-express.ru/russia/cup/2011-2012/playoff/
Их может быть и больше.
Собирать для футбола требуется: названия команд, результаты, дату игры, если есть возможность, то страну, из которой команда.
Скрипт работает на хостинге, и запускается периодически. Например, раз в день. Особой производительности от него не требуется.
Хранить результаты предполагается в базе, например, в MySQL. Реализация, наверное, предпочтительна на PHP. И еще, нужна как можно более прозрачная реализация, потому что обязательно понадобятся другие разделы sport-express.ru, и другие сайты. Чтобы это потом легко было увязать воедино.
Схема работы, как я её вижу: парсер берет url из конфигурационного файла (в каждой строчке — url). Парсит в порядке нахождения url в конфигурационном файле. Прошу обратить внимания, что я не разбираюсь в данной области, поэтому, жду от исполнителя критики данного решения.
Мне нужен исполнитель, обязательно уже писавший парсеры.
Я никуда не тороплюсь. Бюджет — 4000-5000 руб. Предлагайте ваши цены.