парсер по заданному запросу в гугел через прокси
Парсер гуугель
Запрос inurl:bbs.cgi
Results 1 - 25 of about 1,320,000 for inurl:bbs.cgi. (0.11 seconds)
http://www.google.com/search?num=25&hl=en&client=opera&rls=en&hs=UHM&q=inurl%3Abbs.cgi&btnG=Search
лимит
Требуется написать парсер, которому на вход дается список файлов. Результаты складируются в отдельный файл.
Формат данных в файлах незначительно отличается (разные версии программ, генерирующих данные),
Имеется частная rss-подписка, аккумулирующая новости определенной тематики. Доступ к ней через веб-интерфейс (логин/пароль, post-запрос). Требуется написать Jabber-бота, который извлекал бы новости с этой веб-страницы в виде простого текста (заголовок, сообщение, ссылка) и отправлял в чат с заданной периодичностью. Каждая новость не должна быть послана в чат дважды. Язык реализации — Java (библиотека Smack). Желательно оформить программу в виде OSGi-модуля