Вам часто может понадобиться преобразовать файл PDF в HTML, чтобы встроить его в веб-страницу. Чтобы выполнить это преобразование программно, в этой статье рассказывается, как преобразовать файл PDF в HTML с помощью Java. Кроме того, вы узнаете, как использовать дополнительные параметры для настройки преобразования PDF в HTML.
- Java API для преобразования PDF в HTML
- Преобразование PDF-файлов в HTML
- PDF в HTML с дополнительными параметрами
Java API для преобразования PDF в HTML
Чтобы преобразовать PDF-файлы в HTML, мы будем использовать Aspose.PDF для Java. Это многофункциональный API для работы с PDF, который позволяет создавать, изменять и преобразовывать PDF-файлы. Кроме того, он предоставляет простые в использовании методы преобразования PDF-файлов в HTML-страницы. Вы можете либо скачать API, либо установить его, используя следующие конфигурации Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Преобразование PDF в HTML на Java
Ниже приведены шаги для преобразования файла PDF в HTML с помощью Java.
- Загрузите документ PDF, используя класс Document.
- Преобразование PDF в HTML с помощью метода Document.save(“pdf-to-html.html”, SaveFormat.Html).
В следующем примере кода показано, как преобразовать PDF-файлы в HTML.
// Загрузите исходный PDF-документ
Document pdfDocument = new Document("PDFToHTML.pdf");
// Сохраните файл PDF как HTML
pdfDocument.save("pdf-to-html.html", SaveFormat.Html);
Java PDF в HTML с дополнительными параметрами
Aspose.PDF для Java также предоставляет дополнительные параметры для настройки преобразования PDF в HTML. Например, вы можете сжать изображения, разделить вывод на несколько HTML-страниц, указать папку для изображений и т. д. Ниже приведены шаги для указания дополнительных параметров преобразования PDF в HTML.
- Загрузите документ PDF, используя класс Document.
- Создайте экземпляр класса HtmlSaveOptions.
- Установите нужные параметры, такие как HtmlOptions.setSplitIntoPages(true), чтобы разделить содержимое HTML на несколько страниц.
- Преобразование PDF в HTML с помощью метода Document.save(“pdf-to-html.html”, HtmlSaveOptions).
В следующем примере кода показано, как настроить преобразование PDF в HTML.
// Загрузите исходный PDF-документ
Document pdfDocument = new Document("PDFToHTML.pdf");
// Создать экземпляр HTMLSaveOptions
HtmlSaveOptions htmlOptions = new HtmlSaveOptions();
// Разделить вывод на несколько страниц
htmlOptions.setSplitIntoPages(true);
// Сохраните файл PDF как HTML
pdfDocument.save("pdf-to-html.html", htmlOptions);
Вы можете изучить другие варианты, используя следующие ссылки на документацию.
- Избегайте сохранения изображений в формате SVG
- Сжатие изображений SVG во время преобразования
- Укажите папку изображений
- Создание последующих файлов только с содержимым тела
- Отрисовка прозрачного текста
- Рендеринг слоев документа PDF
- Исключить ресурсы шрифта
Получить бесплатную лицензию
Вы можете использовать Aspose.PDF для Java без оценочных ограничений, используя временную лицензию. Получи свой сейчас.
Вывод
В этой статье вы узнали, как конвертировать PDF-файлы в HTML с помощью Java. Кроме того, вы увидели, как использовать различные параметры для настройки преобразования PDF в HTML. Вы можете узнать больше об API, используя документацию. Кроме того, вы можете размещать свои запросы на нашем форуме.