Фрилансеры предложат решение вашей задачи уже через несколько минут!
Публикация заказа не займет много времени.
8 месяцев назад
Тер С.
Тер С. 
44 года, США
11 лет в сервисе
Был онлайн 5 дней назад
8 месяцев назад

Вам будут выданы пачки пар: pdf документ и json объект. Пример приколот внизу. Вам надо будет выбрать подходящий OCR движек и попытаться сделать следующее: 
1) ну, собственно прогнать OCR по самому документу  (первые две страницы с лого Prо Titlе USА можно отрубить)
2) посмотреть какой из существующих движков/библиотек позволяет порезать документ на фрагменты не являющиеся текстом (росписи там, элементы оформления) и собственно текст по параграфам
3) посмотреть какой из движков позволяет высчитать точное направление строк (то есть вот тут http://prntscr.com/evq4tf угол между зеленой горизонталью и красной линией, собственно направлением строк)
4) ВАЖНОЕ! прежде чем OCRить надо посмотреть - может это pdf с текстом. Тогда не надо OCRить, надо просто прочитать :)

В качестве результата должен быть сдан код, который забирает pdf и json и выдает вот эти вот пункты 1, 2 и 3 для каждой страницы документа и отмечает поля JSONа встретившиеся в тексте. Как тут показано http://prntscr.com/evq762  Сверху оригинал (предположим что он успешно про OCRился), соответственно на 12ой странице проOCReнного текста слова "US Bank, NA, as Trustee for Prof-2013-S3 Remic Trust VI" надо будет подчеркнуть или иным образом отметить. Можно в базе пометку, не важно. Лишь бы я мог птом машинно разобрать. 

Я раздам проект нескольким людям, в зависимости от предложенных для исследования библиотек. Задача стоит не в том, что бы добиться идеального распознания, а в том, что бы сделать четкий обзор того, что из каких популярных и развитых движков можно в этом направлении выжать.

Пожалуйста, отзывайтесь если вы или уже знакомы с какой-то библиотекой/движком или готовы сперва разобраться, а потом делать ставку. Я не дам проект пока не убежусь что вы в курсе о чем говорите.

Детали:
1) для тренировки могу выдать до 100 пар PDF+JSON
2) Использовать Гугль Вижн АПИ можно и нужно, но а) только кому-то одному, а не всем и б) нарегестрируйте аккаунтов несколько там сами плз. Что бы за бесплатный лимит 1000 не перевелить прямо во время тестов. 
3) Глобальная цель в том, что бы проверять результаты работы. То есть сверять аккуратность JSON с текстом сканов. Нам понадобится потом еще и порезать документ на правильные фрагменты. Как вот тут http://prntscr.com/evq762 Sold to "XXX" (сверху, из PDF) как раз и означает Current Owner (из JSON). Если у вас есть опыт/мысли на эту тему - не стесняйтесь озвучивать. 
4) Если кто-то справится с задачей очень хорошо, то я предложу постоянную работу с переездом в Доминиканскую Республику. С очень хорошей зарплатой. 

Войдите в аккаунт, чтобы посмотреть приложения к заказу.

Заявки фрилансеров

Денис К.
Денис К. 
36 лет, Россия
8 месяцев в сервисе
Был онлайн 3 часа назад
8 месяцев назад
Михаил Глухов
34 года, Россия
9 месяцев в сервисе
Был онлайн 5 месяцев назад
8 месяцев назад
Сергей Брава
31 год, Россия
7 месяцев в сервисе
Был онлайн 5 месяцев назад
7 месяцев назад
Олег Д.
Олег Д. 
49 лет, Казахстан
2 года в сервисе
Был онлайн 4 месяца назад
7 месяцев назад
Илья Дудкин
50 лет, Украина
7 месяцев в сервисе
Был онлайн 7 месяцев назад
7 месяцев назад
Эмиль А.
25 лет, Россия
11 месяцев в сервисе
Был онлайн 4 месяца назад
7 месяцев назад
Никита Ершов
17 лет, Россия
7 месяцев в сервисе
Был онлайн 7 месяцев назад
7 месяцев назад
Кирилл Белов
Кирилл Белов 
20 лет, Узбекистан
10 месяцев в сервисе
Был онлайн 1 месяц назад
7 месяцев назад
Даниил Белов
17 лет, Украина
7 месяцев в сервисе
Был онлайн 6 месяцев назад
7 месяцев назад
Эдуард Ч.
Эдуард Ч. 
23 года, Украина
7 месяцев в сервисе
Был онлайн 3 месяца назад
7 месяцев назад
Дмитрий Г.
36 лет, Россия
1 год в сервисе
Был онлайн 2 месяца назад
7 месяцев назад
Константин Маноле
25 лет, Молдова
7 месяцев в сервисе
Был онлайн 7 месяцев назад
7 месяцев назад
Оваким С.
Оваким С. 
35 лет, Армения
10 месяцев в сервисе
Был онлайн 1 месяц назад
7 месяцев назад
Давид Ш.
Давид Ш. 
28 лет, Россия
4 года в сервисе
Был онлайн 2 месяца назад
7 месяцев назад
Алексей К.
22 года, Россия
2 года в сервисе
Был онлайн 2 месяца назад
7 месяцев назад
Азамат Болиев
29 лет, Россия
10 месяцев в сервисе
Был онлайн 5 месяцев назад
7 месяцев назад

Похожие заказы

Создание модуля DLL "Копирование базы данных в архив"

ПОСТАНОВКА ЗАДАЧИ Написать дополнительный модуль для программы, работающей с базой данных mdb (формат Microsoft Access 97). Задача модуля: сделать копию файла базы данных в другой каталог (это будет архив), а из оригинала файла базы данных удалить ст...

Программа генератор кода постоянно повышающейся цены.

Общие сведения о программе и ее назначении. --------------------------------------------------------------- Назначение: Генерирует код постоянно повышающейся цены. Пользователь заполняет несколько бланков, выбирает нужные платежные системы, функци

Анализатор кода

Требуется написать программу, которая будет работать как демон и делать следующее: 1. Получает информацию из базы данных, MySQL (url-сайта, текст ссылки, url-ссылки) 2. Получает данные по адресу url-сайта (страница c html кодом) 3. В получен

Сделать маленький http сервер на VC

Требуется сделать маленький http сервер на VC. Требования: минимальное занимаемое место в памяти. обработка post/get запросов, использование интерпретатора php5, Работа в качестве сервиса.

Нужно сделать 3D программу - визуализатор

У нас есть файл с массивом 3D точек с цветом в каждой точке Реализовано: Триангуляция по этим точкам Совмещение 2х поверхностей Вычесление обьёма между этими поверхностями Есть DLL и тестовая программа которая всё это делает Нужно изпользуя данное,

Кнопка ПЕЧАТЬ ОКНА для браузера под Windows и Macintosh

Платформа: Необходимо сделать инсталируемую программу для Windows и Macintosh, которая будет добавлятьяс в браузер в виде кнопки. Работать должна с InternetExprorer версии 5.2 и выше. Желательно, чтоб был вариант для Netscape 5.0 Программа должна им

Компании требуется команда программистов для создания программы под платфор

Компании требуется команда программистов для создания e-book на основе Haali reader для Windows Mobile, Pocket PC, Windows CE и Windows. Компиляция из word. Механизмы защиты посредством ввода ключа на сайте. По возможности компилятор не exe, а php.

Java соединить C++ (*.Dll) через JNI, разовое, но возможно долгосрочное сот

День добрый, нужно связать яву с библиотекой на c++ (*.dll) чтоб потом можно было вывести расчеты, которые делаются в этой dll на экран с помощью jsp с выводом не проблема, проблема с подключением Java + C++ (*.dll) пока хотим использовать метод JN

Создание системы Virtual Classroom на основе FMS2 (Flashcom)

Многоэтапный проект по разработке системы дистанционного обучения основанной на Flash Media Server (Flash Communication Server, FlashCom, FCS, FMS). Система будеть иметь много общего с Adobe Breeze. Сдельная оплата. Очень интересная работа с потенциа...

Сделать универсальный макрос + настройка

Добрый день! Нужно сделать программу макрос. Добавить туда анкеты банков формата эксель (пришлю на почту), заполнить главную страницу и настроить, чтобы вбивая данные на главную страницу, она отображалась в остальных анкетах. Пример работы есть. Прос...