Работающий сайт http://www.wineexpert.kiev.ua/ Виртумарт на Джумле. 1. Оптимизировать 2. Довести до ума (без фанатизма). 3. Настроить, ускорить, убрать лишнее. 4. Подстроить его под поисковики. 5. Подправить немного шаблон: ограничить ширину левого и ...
Парсер аксесс логов PERL (Огромные файлы)
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Нужно сделать, парсер который бы делал следующее:
В аксесс логах строчки запросов к нашему серверу, каждый запрос имеет параметр mag_did то есть индентификатор партнера.
В каждой строчки, есть параметр mag_ua - USER agent, я предоставлю список USER agent которых считать за ботов, и не считать по ним стату
В разреше каждого партнера мне надо пропарсить фаил и собрать следующую инфу
[Ключ партнера] =>
array(
[Ключ файла] =>
array(
'mag_sait_www' => Из переменной mag_durl=http://yandex.ru/file.phpdfsd Вытаскиваете название домена
'num_view' => 'Количество просмотров, просто сумма записей с mag_did отбросив ботов'
'ip' => 'Вот он: 127.0.0.1 - - [26/Jan/2010:01:45:00 +0300] "GET /partner/dealer.php?mag_durl=index.php&mag_did=1653&''
Предлагаю следующие параметры, описывать в конфиге в виде параметров которые должны быть найдены в строчках:
'num_in_cart=> 'Количество заходов в корзину, в ссылке должно msnm magaz=cart
'num_make_orders' = > 'В запросе чтобы был magaz=agree''
[Ключ products]=>array (По каждому mag_prodid посчитаться Количество просмотров)
[Ключ seo] => array (Ключ из файла бана ботов => Количество)
)
);
То есть пример лога:
127.0.0.1 - - [26/Jan/2010:01:45:30 +0300] "GET /partner/dealer.php?mag_durl=index.php&mag_did=5318&mag_version=101&magaz=info&mag_prodid=11945&mag_ua=Xap+Spider+Bot+2.0 HTTP/1.0" 200 127
127.0.0.1 - - [26/Jan/2010:01:45:30 +0300] "GET /partner/html/ver2/sales.php?url=index.php&col=2&man= HTTP/1.0" 200 -
127.0.0.1 - - [26/Jan/2010:01:45:30 +0300] "GET /partner/title.php?magaz=info&mag_prodid=1043&mag_model=P700 HTTP/1.0" 200 311
Я в конфиге пишу
script_stat=array('dealer.php', 'sales.php', 'title'.php)
И для каждого файла опишу настройки, какие собирать параметры (Те ключи которые я описал выше num_view итд)
То есть неапример для файла dealer.php - мне надо всю статус собрать, то есть все параметры что описал выше
Для sales.php только num_view
После распарсивания, фаил удаляется, а записи заносяться в базу:
а) Проверяете есть ли такой сайт в базе по выташеному боту
mag_sait_www
select * from affiliate_sites where affiliate_site='mag_sait_www'
Если нету делаете insert
insert into affiliate_sites(id
affiliate_id
name
affiliate_site
tick)
values
(
'',
mag_did,
Домен выташенный,
Домен выташенный,
3
)
После встапвки записи, делаем insert или update в таблицу affiliate_statistics
http://static.sotmarket.ru/screen/seva/20100128-uhr-144kb.jpg
insert если нету записей с date=Дата парсиньтя
update если есть
ICQ 997544
- Похожие заказы
- Веб-программирование9 заявокЗакрыт14 лет назад
Здравствуйте. Нужно доработать экспорт WebAssit В кратце есть фрагмент кода : $sql = "select productID, ".LanguagesManager::sql_prepareField('name')." AS name, Price, categoryID, default_picture".$dsc_q.", in_stock, slug from ".PRODUCTS_TABLE." where ".(count($_ProductIDs)?"productID IN(".implode(", ", array_slice($_ProductIDs, $iter, 100)).") AND ":"")."enabled=1".$clause; Как из него ...
Веб-программирование1 исполнительЗакрыт14 лет назадНеобходим компонент либо плагин для Joomla 1.5. Его функция: методом GET передается поисковый запрос, компонент или плагин этот запрос передает методом POST в компонент HotProperty1.0, после чего выдается результат поиска. Либо расширить компонент HotProperty1.0: добавить возможность отправлять ...
Веб-программирование1 исполнительЗавершен14 лет назадЗадача: Выполнить работу по ТЗ. Сайт: automerin.ru
Веб-программирование1 исполнительЗавершен14 лет назадНеобходимо разработать флешь ролик по сценарию (сценарий в приложении).
Веб-программирование16 заявокЗакрыт14 лет назадНЕ ДЛЯ СПАМА!!! Для seo эксперимента нужно найти 20-40 разных фри хостов (видимо, с поддержкой ftp), можно без поддержки php (хватит только html) и зарегить 2-3 тысячи различных сайтов (с сохранением их данных в базе данных). После ...
Веб-программирование2 заявкиЗакрыт14 лет назад- $300
Требуется спарсить 20 магазинов с товарами. Цена по 15$ за парсер.
Веб-программирование1 исполнительЗавершен14 лет назад - $10
Нужно корректно раставить в горизонталь, а не как сейчас - вертикаль. Все в прикрепленних файлах. Заранее благодарен.
Веб-программированиенет заявокЗакрыт14 лет назад Нужно исправить кое что в сайте-по списку. В архиве адрес сайта+список исправлений. Какой движек? - не знаю :) исправления нужно сделать только в русской версии
Веб-программирование1 исполнительЗавершен14 лет назад- $200
ТЗ обсуждено в переписке по аське между заказчиком и исполнителем
Веб-программирование1 исполнительЗавершен14 лет назад