Граббер: анализатор беклинков
Обязателен опыт разработки грабберов.
Необходимо написать класс на PHP5 (для легкой подключаемости в состав других скриптов)
который будет анализировать внешние ссылки для сайта.
Принцип работы:
1) Сссылки берутся из Гугла, Yahoo, MSN
2) Полученные проверяются на индексированность в яндексе
3) скрипт должен работать с MySQL (информацию о проекте слкадывать в нее)
4) при запуске для проекта после анализа складывается следующая информация:
- собственно ссылки (домен, где установлена; точные адрес страницы; анкор текст; на какую страницу ведет; индексирована или нет Yandex; открыта ли для индексации; размещена ли внутри ; сколько еще ссылок на странице внешних; параметры сайта (ТИЦ, PR)
- всего внешних ссылок на каждую дату прверки
- изменение внешних ссылок (какие добавились новые, какие пропали)
- вывод внешних ссылок по анкор-текстам (с фильтром на новые, пропавшие)
- вывод графика распределения – по ТИЦ, кол-ву внешних еще на этой странице, кол-ву всего ссылок с морд \ внутренних
5) возможность установки паузы при запросе данных (чтобы не банил яндекс при проверке на индекс и т.п.), использование рендомности пауз, возможность указать прокси для использования.
6) возможность запуска из крона
7) вывод списка проектов с данными на текущий момент (URL проекта, дата проверки, кол-во всего внешних, кол-во морд из них, кол-во внутренних)
8) возможность в списке фильтрации проектов по группам (тематики, например: строительство – вывод только по строительству) и т.п.)
Конечный вид скрипта:
класс
sql-дамб для подключения
шаблоны (лучше smarty)
важен опыт парсинга данных с ПС, с учетом знания их нелюбви к граббингу, чтобы не забанили IP.
======>>>Предложения просьба отправлять на ICQ: 446430822. Здесь не смотрю.