C# Распарсить страницу сайта, вывести рекомендации
Нужно на C# (обязательно для msvc 2008) сделать функцию, которая по имеющемуся тексту html-стираницы сформирует отчет вот в таком виде: http://www.rooletka.ru/Report/Page?hash=48f87382a582a7ac348c6c19f6e919b5&pageId=0a46bafbb6d5ed502db6a781849654f7
Всего 30 параметров страницы, которые нужно извлечь из html и проанализировать. В результате анализа каждого параметра на странице отчета должен появляться один из трех вариантов. Замечаний нет (цвет - зеленый), Есть замечания: тип замечания (цвет - желтый), важное замечание: тип замечания (цвет - красный). Полный перечень условий для каждого параметра, и условия выдачи той либо иной рекомендации будут выданы исполнителю в виде ТЗ в текстовом файле.
Итак на входе разрабатываемой функции (html текст страницы, время ее загрузки с сервера, статус ответа, Уровень вложенности страницы)
На выходе страница с отчетом в html виде с анализом следующих параметров:
URL страницы
Заголовок страницы
Описание ключевых слов
Описание страницы
Время загрузки
Уровень вложенности
Естественность текста (ключевые слова)
Изображения
Внутренние ссылки
Внешние ссылки
Нежелательные элементы
Конверсионные элементы (показать)
За дополнительную плату можно разработать функцию определения уникальности текста в пределах сайта методом шинглов, имея массив всех шинглов текущего сайта.
Все замечания и важные замечания для каждого анализируемого параметра нужно вносить в отдельный массив, для формирования общего отчета по всему сайта, как здесь http://www.rooletka.ru/Report/Summary?hash=48f87382a582a7ac348c6c19f6e919b5 (Эту работу орпять же можно будет сделать за дополнительную плату)