Бот на python чтобы скопировать дынные из html5 iframe
Нужно написать бот на языке python который:
- зайдет на вебстраницу,
- распознает кнопки,
- сделает клики в html5 iframe чтобы открыть нужные данные,
- сделает скиншот,
- распознает текст OCR (pytesseract),
- вытащит нужное число из текста
- соханит его таблицу (можно SQLite, Pandas или просто csv ).
Страницы которые бот будет скрейпить и вставки iframe будут разными но структура примерно одинаковая. Скрипт должен быть гибким чтобы его можно было настроить на разные кнопки в iframe (то есть он должен работать не по координатам на экране).
В данный момент наиболее вероятный вариант исполнения кажется использование OpenCV и Selenium Webdriver. Альтернативные варианты и библиотеки тоже приветствуются – например если данные скопированы без распознования скриншотов и Selenium взаимодействует с iframe напрямую. Если разработчик найдет способ скопировать данные через Network files / JSON – это тоже приветствуется. Ограничение – нужно использовать python, бот и иcпользуемые библиотеки должны работать на linux.
Данные для сохранения в таблицу:
- название сайта,
- название страницы
- число.
GUI не обязательно, нужен код который можно запустить через терминал.
Более детальное техническое задание с нужными ссылками будет после выбора предложения/предложений.
При успешном выполнении вероятно дальнейшее сотрудничество.
Дедлайн 25 августа.