Нужно написать парсер(ы) заданного списка форумов
Есть список форумов, сгруппированных по типу используемого движка (пока что это только IPB, phpBB и vBulletin). Нужно написать парсер контента с этих форумов на PHP (можно несколько парсеров, на каждый тип движка). Парсер должен быть серверным, т.е. чтобы была возможность запускать его по cron'у и смотреть логи его работы в каком-нибудь файле.
Всю информацию нужно складывать в MySQL-базу, примерную схему таблиц я вышлю выбранному исполнителю. Для удобства в этой же базе можно создавать свои вспомогательные таблицы, мне важно наличие только моих таблиц.
Необходимо сохранять следующую информацию:
1. название темы на форуме (topic name)
2. все сообщения в теме с никами авторов, датами и текстами сообщений
3. если есть какие-либо вложения в теме (attachment), то их необходимо выкачивать и сохранять у себя (над этим думайте сами). Если это вставка на сторонний ресурс, например, youtube, то ничего скачивать не надо.
4. для каждой темы нужно еще сохранять ее категорию/раздел (обычное текстовое поле). Например, если это программерский форум, то очень часто форум разбивают по языкам программирования, используемым технологиям и т.п.
Бюджет я пока не назначаю, буду смотреть на предложения фрилансеров.
Предпочтение отдается исполнителям с подобным опытом работы.
Оплата в WMR.