Скрипт мониторинга сайтов
Админская часть: список сайтов, у каждого сайта - список урлов.
Для добавления урла используется: урл, почта куда высылать (или
через запятую почты).
Скрипт работает, и по Крону раз в сутки минут стучится к каждому урлу
методами Get, Post.
1. Для каждого сайта можно задать список урлов страниц, которые будут
мониториться на изменение (текст страницы, title). Т.е. при первом запуске скрипт сохраняет
копию страницы и дату сохранения, а затем сверяет с текущим вариантом. Делать такую
проверку можно раз в сутки. Также необходима возможность перезапуска:
т.е. если мы сознательно страницы поменяли, нужно дать указание
скрипту создать новые эталонные страницы.
Идеально, если можно прямо в админке посмотреть, что именно изменилось
на странице. Например, измененный текст выделяется другим цветом. См. например Website-Watcher, Avalanche.
Можно предусмотреть ведение лога истории изменений: в текстовый файл
пишется дата и текст, а в админке можно выбрать дату и посмотреть,
какой был текст на эту дату.
2. Проверка на дубликаты
(http://www.siteprogramm.ru/content/view/15/36/ вот аналог).
Общий принцип поиска дубликатов: берем прямые текстовые вхождения на сайте и ищем их в яндексе.
Т.е. алгоритм такой: скрипт "нарезает" текст на много небольших кусочков и
отправляет запросы в поисковик. Если в выдаче присутствует аналогичный
текст, то скрипт делает запись в файл - адреса найденных страниц.
Можно задать процент тревоги: например, если 20% всех проверенных
кусочков имеет дубликаты, то высылать на имейл предупреждение.
Проверка также раз в сутки.
Пишите, пожалуйста, цену за такой функционал: за базовый, а также за расширенный (идеально, можно и пр. в тексте). Предложения скрыты.