Распонование текста на pythonили php
Требуется сделать распознавание надписи на python с помощью библиотеки Tesseract , или что-то подобное, работать должно быстро, 2-3 изображения в секунду
PHP (в нижней части изображения на полосе.
Реализовать хотелось бы следующим образом:
1. Берем изображение и вырезаем с него полосу снизу
2. Переводим полосу снизу в черно белое инвертированное представление
3. Переводим черно белое представление в массив из 0 и 1
4. Находим в данном массиве все символы (это области смежных 1)
5. Переводим массив каждого символа в строку и сравниваем с эталоном через расстояние Левенштейна (в php есть готовая функция для этого). Там где степень схожести наибольшая - и есть искомый символ.
6. Формируем посимвольно надпись с изображения.
Или можете предложить ваш вариант реализации, который будет работать не хуже.