Исправить парсер контента сайтов на java
Андрей11 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
21.07.2014
Есть парсер контента
Вот его демка
http://boilerpipe-web.appspot.com/
тут его библиотеки
https://code.google.com/p/boilerpipe/
тут готовое сконфигурированное решение, которое я на данный момент использую
https://github.com/remdex/boilerpipe-and-language-detect-api-server
нужно добавить возможность вытаскивать картинку статьи. этот функционал есть в библиотеки, и представлен на демо сайте.
вы можете использовать или готовое решение, или написать свой скрипт. в интернете много примеров реализации данного механизма