Нужны два парсера
Нужны два парсера.
Бюджет обсудим, пишите ваши предложения.
== Очень кратко ==
На вход - сайт оператора наружной рекламы.
На выход - таблица из минимум трех полей
(Город - строка, Тип конструкции - строка, Адрес конструкции)
любые дополнительные поля (стороны, GRP и т.д.) - только в плюс.
Нужна цена и сроки, а также пример Вашего кода.
Если сойдемся, возможна регулярная поддержка и заказы на еще ряд парсеров.
== Подробно ==
1. Первый вот тут: http://www.gallerymedia.com/Program/default.aspx
Нужно сымитировать отправку формы, и вытащить адреса конструкций разных типов, например, Биллбордов
Трудность в том, что сайт на ASP.net, и простым Snoopy на PHP сходу его не возьмешь (см. код ниже)
// Вот так за 5 минут не удалось его одолеть :)
include('Snoopy.class.php');
$snoopy = new Snoopy();
$post_array = array();
$post_array['ddlCityList'] = 'MOSCOW';
$post_array['ddlTypeList'] = '1-MT';
$snoopy->agent = "Mozilla/5.0 (Windows; U; Windows NT 6.1; uk; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13 Some plugins";
$snoopy->referer = "http://www.gallerymedia.com/Program/default.aspx";
$snoopy->rawheaders["Host"] = "gallerymedia.com";
$snoopy->maxredirs = 2;
$snoopy->submit('http://www.gallerymedia.com/Program/default.aspx', $post_array);
echo $snoopy->results;
2. Второй вообще с авторизацией и редиректом.
логин/пароль: [email protected] / 123456
(если логин и пароль не будут пахать - зарегистрируйтесь сами. это быстро, может они просто вычислят левую пару. во время работы настоящего парсера у нас будет стабильный логин-пароль).
точно так же, посмотрите, там идет ссылка вида
которая прегенерится в некий кэшированный результат, и браузер редиректит, опять же, на страницу с адресами рекламных конструкций выбранного типа.