Программа - конвертер HTML кода сайтов в PDF
Здравствуйте!
Требуется написать программу для конвертирования HTML кода одиночных страниц сайтов в качественные PDF-документы и создания скриншотов в JPG/PNG.
Т.е., аналог сервиса - https://webtopdf.com/ru/ с необходимыми настройками, но, под Win.
Протестировал порядка 50-ти сервисов, но, ни один не устроил по качеству.
Проблема всех сервисов в том, что они не скролят страницу сайта, в случаях частичной/постепенной загрузки контента.
В итоге, страница преобразуется в PDF некорректно или не полностью.
Более-менее корректно работает сервис - https://www.ilovepdf.com/ru/html-to-pdf .
Но, все-равно, есть погрешности.
1. Возможность одновременной работы нескольких экземпляров программы из разных папок.
2. Настройки обработки выносим в отдельный файл:
1) URL страницы сайта для обработки;
2) Обработка страницы полностью или только видимой/загруженной части страницы/кода;
3) Пауза для ожидания полной загрузки сайта;
4) Количество эмуляций PageDown перед преобразованием страницы, если требуется скроллинг;
5) Путь для сохранения PDF и JPG/PNG на локальном диске или с загрузкой по FTP (если на сервере
нет такой структуры папок, то создаем их, в соответствии с заданным путем).
6) Выбор - сохранять PDF в виде одной большой страницы или разбивать постранично.
3. Возможность обработки страниц сайтов как полностью (прокрутка вниз, до полной загрузки страницы), так и только видимой части страницы, в зависимости от настроек.
4. Возможность настройки постраничной корректной разбивки PDF документа, по заданным тегам в коде или строкам текста на сайте. Т.е., чтобы в итоговом PDF документе ключевые блоки сайта (заголовки блоков) начинались с начала страниц, а не с середины.
5. Возможность запуска программы через BAT-файл.
6. Автоматическое завершение работы программы после каждого цикла обработки (каждой страницы).