Разбор html страницы регулярными выражениями
Требуемые знания для реализации проекта – PHP + базовые знания регулярных выражении. Можно начать их изучать по приложенному коду и http://ru.php.net/manual/en/function.preg-match-all.php с http://wmdn.ru/php/regular-expressions-in-php/.
Шаблон решения уже сделан! Скачивайте и адаптируйте к разбору других данных :)
Желательно, но не обязательно, уметь тестировать с использованием phpUnit и настроить тесты под каждый парсер.
Общая задача: со страницы профиля пользователя снимаем следующие пристуствующие данные:
* никнейм [nickname]
* дата регистрации [reg-date]
...
---
полный текст ТЗ в файле parser.txt и пример кода – в аттаче.
---
На выходе – под каждый сайт – свой класс со снятием максимально доступного количества данных, тесты минимум на 5 аккаунтах данного сайта.
Принимаются также пожелания по архитектуре данного решения. Например, часть форумов на vBulletin, часть Invision Power Board. Возможно, проще выделать их в отдельный класс, написать под него парсер, в наследуемых классах обрабатывать дополнительные настройки профиля каждого форума.
В предложения пишите
1. опыт работы с php
2. опыт работы с автоматическим тестированием phpUnit
3. срок выполнения работы
4. желаемое вознаграждение