Написать парсер/граббер
Требуется написать парсер/граббер для получения технических текстов с гос. сайта. Текстов где-то 13 тыс. После получения самих текстов, нужно будет их распарсить, чтобы разные части текста попадали в разные поля базы данных. Если кратко и очень условно, то можно разделить задание на
несколько частей:
1. Изначальная загрузка всех 13 тыс. текстов. Список текстов с адресами есть.
2. Написание парсера, который будет разные части текста сохранять в разные поля БД.
3. Написание разных дополнений. Например, по проверке актуальности текстов и повторной загрузке неактуальных статей.
4. Интеграция всего указанного выше с уже работающим сайтом.
Язык программирования: PHP. Сайт написан на PHP, поэтому и граббер/парсер тоже должен быть написан на нём. Сайт работает на Drupal 7, но вам не обязательно знать эту CMS. Интеграцию с CMS поможет сделать другое специалист.
Тех. задание не очень чёткое и может меняться на ходу, поэтому оплата почасовая. Если вы оставляете предложение, то,
пожалуйста, пишите какая оплата в час вас бы устроила.