Парсер выдачи гугла
Задачка простая:
1й модуль:
1. Парсим выдачу гугла по запросу site:http://site.ru (где http://site.ru задается пользователем)
2. Проверяем каждую ссылку на соответствие регулярному выражению (об этом подробнее с выбранным исполнителем)
3. Если соответствует регулярке - записываем в базу.
2й модуль:
1. Берет ссылки из базы и проверяет для них pr. Можно использовать API RDS, или как будет удобно.
В идеале это серверная софтинка, которая лежит себе на сервере (Linux-сервер предпочтительнее) и запускается по расписанию крон. Задача: найти все ссылки с pr.
Ссылок много (всего проиндексирована ок. 50.000 по трем сайтам, ок. 15% из них имеют pr) т.е. ресурсоемкость такой софтинки и время выполнения задачи также следует учесть.
Средства реализации на ваш выбор, только не php.
Все предложения строго в проект.