Автоматизированный парсинг и постинг на форумах
Цель: необходимо спарсить контент (темы, ответы в темах, ники пользователей, аватары) на форуме источнике и разместить его на принимающем форуме.
Источник не мой, принимающий форум мой.
Размещение через БД не подходит, необходимо решение которое будет работать через функционал форума.
Требования: На принимающем форуме контент должен размещаться постепенно, через случайные промежутки времени из заданного диапазона, в той же последовательности в которой он был размещен на форуме источнике, создавая видимость наполнения за счет естественной активности пользователей. Размещение не должно проходить линейно (Линейно это – создание одной темы, её полное заполнение ответами, создание следующей темы).
Задачи, которые необходимо выполнить для достижения результата:
Парсинг форума источника
1.1. Авторизация на форуме
1.2. Парсинг контента в базу данных
1.3. Учет соответствия разделов источника и принимающего форума при создании базы данных
1.4. Учет хронологического порядка размещения контента при создании базы данных
1.5. Сохранение привязки сообщений к их автору при создании базы данных
1.6. Сохранение информации о профилях пользователей (никнейм, аватар)
Размещение контента на принимающий форум
2.1. Регистрация нового пользователя и заполнение профиля в соответствии с сохраненной информацией с форума источника
2.1.1. Изменение ника нового пользователя в случае его совпадения с ником существующего пользователя (есть вариант замены английских символов кириллицей)
2.2. Создание тем / размещение ответов в темы
2.2.1. Замена несоответствий (URL форума источника, упомянания его названия и т.д. заменяются на адрес, название принимающего форума, исключение не поддерживаемой графической составляющей, смайлов и т.д.)
2.2.2 Обеспечение правильности BB кодов (цитирование сообщений, форматирование текста и т.д.)
2.3. Задержка при размещении контента
2.3.1. Случайная задержка между созданием новых тем
2.3.2. Случайная задержка между размещением ответов в одной теме
2.3.3. Случайная задержка между размещением ответов в разных темах
Готов рассмотреть другие решения позволяющее достигнуть заданной цели.
Оплата только после демонстрации работоспособного решения.