RESTful сервис для извлечения текста из PDF файлов
Гость1 год в сервисе
Данные заказчика будут вам доступны после подачи заявки
21.11.2023
Необходимо создать:
RESTful сервис для извлечения текста из PDF файлов на python
Краткое тз:
Pdf файл и извлекается в плоский обычный текст, с разбиением на страницы потом вызывается сервис для индексирования документа в базу данных.
При индексировании используется морфология для приведению слов к начальной форме, затем делается статистика, считается количество слов в документе и на каждой странице.
Создается общая база в которой написано сколько встречается слов в тексте
Необходимо выполнить на python в виде рест сервиса
К часам 10 у меня будет Исходник программы которая достает текст
Координаты сервиса который индексирует
И описание рест апи этого сервиса