Написание грабберов
Необходимо сделать грабберы для нескольких десятков веб-сайтов.
Общая схема работы:
1. Обращение к заранее заданным rss каналам.
2. Анализ мета данных страницы.
3. Сохранение текста, фото и видео страницы (исходя из мета данных).
Написать можно на любом языке программирования. Сохраняться все должно в базу данных MySQL.
Вот пример сайта:
Сайт: http://www.cracked.com/top-50.html
Его RSS: http://feeds.feedburner.com/CrackedRSS
Типовая страница для парсинга: http://www.cracked.com/article_19785_5-ways-modern-men-are-trained-to-hate-women.html
Обратите внимание на мета данные с названием og:... - это open graph, там часто находится основная информацию которую и необходимо сохранять.
Интересуют сроки, стоимость и язык программирования для каждого граббера.
Можем отдать все в одни руки, можем в несколько.