Парсер web-справочника
Необходимо написать скрипт (PHP5+MySql5) парсера web-справочника по заданным параметрам (регион, категория). Входящие параметры желательно передавать по id (например, id=1980 для
'автомобили'). При указании родительского id для категорий все подкатегории тоже должны пропарсиваться.
При этом в базу должна записываться информация:
1) id компании
2) id в справочнике
3) регион
4) адрес
5) сайт (если есть)
6) email (есть есть возможность)
7) часы работы (если есть)
8) url в справочнике
+ дополнительная таблица связывающая id компании и id категорий, к которым она относится в виде:
1) id компании
2) id категории
таблица категорий формируется отдельно в виде:
1) id категории
2) id родительской категории
3) id категории в справочнике
4) id родительской категории в справочнике
5) url страницы категории в справочнике
6) название категории
Скрипт должен уметь работать как через http, так и через ssh. Параметры парсинга можно задавать как в самом скрипте, так и входящими, заранее определенными, get-параметрами. При парсинге не делать лишних повторений, т.е. если компания уже есть в базе, не вносить туда информацию заново, это же касается категорий и отношений компания-категория.
Пожалуйста, сразу давайте конкретный оценки по бюджету и срокам по реализации, т.к. надеюсь, что задание написано полно и понятно.
!!Предложения в личку не приветствуются!!
Заранее спасибо!