Программа для анализа сайтов

Гость18 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
11.04.2007

Нужно создать простую програмку для анализа сайта, подсчета бэков, ТИЦ, PR, исходящих и т.д. Подробно-в техзадании.

Программа локальная, данные сбрасываются в табл

ИТАК ТЗ :

Анализ запроса.

На входе:

Запрос к поисковой системе (к Яндексу) – поисковая фраза

Глубина поиска N (количество первых позиций по запросу)

Комментарии и термины

Беклинки ищутся всеми доступными способами Яндекс, Google, MSN, Rambler и т.д. - выбирается при помощи флажков.

Уникальных внешние ссылки - уникальные исходящие внешние ссылки со страницы, незакрытые тегом noindex.

Выделение уникальных беклинков - из всех беклинков с одного сайта оставляются только беклинки с главной страницы сайта, а в случае её отсутствия беклинка со страницы с минимальным количеством уникальных исходящих внешних ссылок.

Вместо морд в беклинках могут внутренние страницы, т.е. часть морд может быть не показана – вместо них может быть показана внутренняя страница.

Поэтому при выделении Морд из списка беклинков, должна быть предусмотрена опция по выбору, которая анализирует наличие ссылки с главной страницы сайта, с которого идёт беклинк.

Пример: для сайта site.ru есть беклинк = http://beksite.ru/page.php - необходимо проверить , есть ли на http://beksite.ru ссылка на site.ru

На выходе:

1. Оценка поисковой фразы: Количество запросов в месяц по Яндексу, Рамблеру и т.п.

2. Список N сайтов (первые N сайтов по запросу в Яндексе)

Для каждого сайта

3. Для каждого сайта ТИЦ, PR, Количество проиндексированных страниц в Яндексе, Google и т.д. - выбирается при помощи флажков.

4. Список всех найденных беклинков.

Для каждого беклинка ТИЦ, PR страницы, количество уникальных исходящих внешних ссылок со страницы, незакрытых тегом noindex

5. Выделение всех морд из беклинков.

Для каждого беклинка ТИЦ, PR страницы, количество уникальных исходящих внешних ссылок со страницы, незакрытых тегом noindex

6. Выделение уникальных беклинков

Для каждого беклинка ТИЦ, PR страницы, количество уникальных исходящих внешних ссылок со страницы, незакрытых тегом noindex

Итого формируются три списка для каждого сайта:

- Все беклинки.

- Беклинки с морд.

- Уникальные беклинки.

Все списки выводятся в таблицы xls и ( или ) xml

5. Анализ по этим спискам:

(По каждому списку в отдельности)

Вычисляется общий ТИЦ, PR

Вычисляется общий относительный ТИЦ = Сумма (ТИЦ сайта, делённый на количество уникальных исходящих внешних ссылок со страницы)