Написать perl/php скрипт, выдирающий инфу из сайта
Есть каталог фирм-разработчиков приложений для айфонов: http://www.appstorehq.com/developers
Надо написать скрипт на php или perl (перл более предпочтителен), который будет работать с командной строки под линуксом. Входные параметры - начальный номер страницы каталога и конечный номер страницы каталога - между которым вытаскивать инфу, а также интервал в секундах между запросами страниц (чтоб не нагружать сервер ).
Для каждой записи в этом каталоге скрипт должен выдавать на STDOUT по одной строке, в формате CSV (то есть столбцы разделенные запятыми) - на примере вот этой записи http://www.appstorehq.com/illusionlabs-4004/developer:
http://www.appstorehq.com/illusionlabs-4004/developer,http://www.illusionlabs.com/,12,2,5
объяснения колонок:
http://www.appstorehq.com/illusionlabs-4004/developer (урл записи)
http://www.illusionlabs.com/ (это домашняя страница фирмы)
12 (общее количество приложений)
2 (количество страниц со списком приложений)
5 (количество ПЛАТНЫХ приложений на первой странице. Платные приложения те, у которых не написано FREE)
То есть код тупо должен идти по каталогу. Таким образом придется реализовать разбор всего 2х типов страниц.
В случае использования Perl - код должен начинаться с use strict. В обоих случаях (php/perl) допускается пользовать любые сторонние модули.
IMHO для написания нужен всего 1 час работы.