Python: отладить добавление данных из одной базы в другую
Есть сайт на Django, каталог бизнесов USA. При помощи утилиты через cron в базу сайта регулярно добавляются записи-объявления.
Записи добавляются поштатово, для каждого штата X записей. При добавлении каждой записи, если в спец. поле есть ссылки на картинки — они скачиваются с сайта-донора объявлений.
При больших значениях X (десятках) возникают различные ошибки, в итоге до последних штатов дело даже не доходит. Также возможно, что сайт-донор на время банит скрипт, и часть ошибок обусловленна этим.
Необходимо:
- пофиксить частые ошибки
- сделать процесс добавления ошибкоустойчивым — если ошибка есть, то запись не добавляется, метится, пропускается, работа продолжается
- если ошибки возникают из-за бана скачивания картинок — сделать процесс добавления равномерно распределённым по 24 часам суток
- если картинки не скачиваются c 2 попыток — то это некритическая ошибка…