Парсер mаil.ru stаt, php
Ищу человека, имеющего опыт в написании парсеров, чтоб палились поменьше, юа, реф. и т.п. передавали
Необходимо написать простенький парсер сервиса http://stat.go.mail.ru/stats на php
Вебинтерфейс не нужен, в самом скрипте требуются настройки:
1) запрос (ключевое слово)
2) время между запросом страниц
3) до какого количества запросов (колонка справа) парсить (включительно)
4) остановить или продолжить парсинг при этом
Дальше в зависимости от пункта 4 - такие варианты событий:
-----------
Если пункт 4 имеет значение остановить, то:
- В папке "keys" должен записываться файл (название - запрос из пункта 1.) с кеями до определенного в пункте 4 кол-ва запросов включительно
- B папку "all" ничего писать не надо
-----------
Если пункт 4 имеет значение продолжить, то:
- В папке "keys" должен записываться файл (название - запрос из пункта 1.) с кеями до определенного в пункте 4 кол-ва запросов включительно
- B папку "all" должен записываться файл (название - запрос из пункта 1.) со ВСЕМИ кеями пока они не закончатся
------------
На выходе должны получаться файлы:
- преобразовывать все буквы в нижний регистр
- каждый кейворд с новой строки
- не должно быть пробелов после кеев
- сохранять файл в кодировке cp 1251
Не знаю имеет это значение или нет, но скрипт будет запускаться из консоли. И еще хотелось бы чтоб он подавал какие-то признаки того что он работает. Отдавал номера обработанных страниц, конец работы или ошибки.