Преобразовать текст из PDF в html
Максим10 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
07.01.2015
Есть документы в PDF. Общий объем - 12 страниц.
Нужно извлечь текстовые абзацы и таблицы, и выдать их в виде HTML.
Абзацы должны быть оформлены тегами-
Списки -
- и
-
Таблицы
. Объединные ячейки - colspan и rowspan. Дополнительно шапка таблицы должны быть офорлмена а тело таблицыНикаких дополнительных стилей и разметки быть не должно.
Заголовки - h2
Рисунки не нужны, колонититулы не нужны.
Текст и таблицы с расставленными тегами должен выглядеть в браузере как исходное содержимое в pdf.
пример содержимого PDF - в скриншоте (это 2 страницы)
Цена в рублях - 1000 руб. (ЗА ПРОЕКТ В ЦЕЛОМ).
БЕЗ ПРЕДОПЛАТЫ.
СРОК - 1 день.