Парсер сайта
Нужно:
1. Все страны http://www.orgpage.ru/areas/ и все области/округа и т.д.
2. Раздел сельского хозяйства http://www.orgpage.ru/rossiya/selskoe-khozyaystvo/
3. Раздел пищевой промышленности http://www.orgpage.ru/rossiya/%D0%BF%D0%B8%D1%89%D0%B5%D0%B2%D0%B0%D1%8F_%D0%BF%D1%80%D0%BE%D0%BC%D1%8B%D1%88%D0%BB%D0%B5%D0%BD%D0%BD%D0%BE%D1%81%D1%82%D1%8C,_%D0%BF%D0%B8%D1%89%D0%B5%D0%B2%D1%8B%D0%B5_%D0%BF%D1%80%D0%B5%D0%B4%D0%BF%D1%80%D0%B8%D1%8F%D1%82%D0%B8%D1%8F/
Тут ссылки для примера получились с Россией, но интересуют все страны.
Собираем по аналогии (http://www.orgpage.ru/krasnodar/chaynaya-chillout-home-945119.html).
- сферы деятельности
- адрес + геометка (гоеметка с точностью до 8 знаков, x и y координаты в раздельные колонки)
- часы работы
- контактные данные
- сайт
- аккаунты в соцсетях
- описание
- товары и услуги
- кратко об организации
- что-то ещё, что может попастся, но не было здесь, по этой ссылке, тоже в отдельную колонку.
---------------------------------------------------------------------------------------
Смотрю достаточно разные просто есть описания:
http://www.orgpage.ru/krasnodar/chaynaya-chillout-home-945119.html
или
http://www.orgpage.ru/podolsk/remit-tk-755926.html
Я боюсь, что не все поля получится учесть сразу, так сказать, в ТЗ. Если вдруг вылезет какой-то ещё объект, где строка, которую не заметили сразу, сможем её тоже подхватывать? Просто вручную все объявления, чтобы все типы зедетктить, нереально прощёлкать.