Парсер рейтинга liveinternet
Здравствуйте! Необходим парсинг рейтинга liveinternet.ru:
- первые 15000 сайтов
- регион "Все страны".
По парсингу:
1. Если у сайта закрытая статистика, то его пропускаем и никуда не записываем.
2. Если у сайта открытая статистика, то:
2.1. Снять количество сессий за ноябрь.
2.2. Снять среднее время на сайте за ноябрь
2.3. Снять количество просмотров на посетителя за ноябрь.
2.4. Если у сайта открыта страница "Из поисковых систем", то:
2.5.1. Снять значения по трафику Яндекс и Google (относительные значения в % за ноябрь).
По функционалу:
1. Экспорт данных в .csv или .xlsx (.xls).
2. Десктоп или серверный вариант — без разницы.
3. Индикатор работы парсера. Необходимо понимать, что скрипт работает, а не завис, например.
Скорость работы парсера не так важна. Если будет парсить 2 часа, то ничего страшного (главное, чтобы без бана ip и т.п.).
Дизайн, юзабилити тоже не важны - задача разовая. Сильно привязан к бюджету (рассмотрю вариант конечного продукта в виде таблицы с данными).
Прошу указать сроки и стоимость.