PDF 到 HTML Java

您可能經常需要將 PDF 文件轉換為 HTML 以將其嵌入到網頁中。為了以編程方式執行此轉換,本文介紹瞭如何使用 Java 將 PDF 文件轉換為 HTML。此外,您將學習如何使用其他選項來自定義 PDF 到 HTML 的轉換。

用於 PDF 到 HTML 轉換的 Java API

為了將 PDF 文件轉換為 HTML,我們將使用 Aspose.PDF for Java。它是一個功能豐富的 PDF 操作 API,可讓您生成、修改和轉換 PDF 文件。此外,它還提供了將 PDF 轉換為 HTML 頁面的易於使用的方法。您可以 下載 API 或使用以下 Maven 配置安裝它。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>21.5</version>
</dependency>

在 Java 中將 PDF 轉換為 HTML

以下是使用 Java 將 PDF 文件轉換為 HTML 的步驟。

以下代碼示例顯示瞭如何將 PDF 文件轉換為 HTML。

// 加載源 PDF 文檔
Document pdfDocument = new Document("PDFToHTML.pdf");

// 將 PDF 文件另存為 HTML
pdfDocument.save("pdf-to-html.html", SaveFormat.Html);

帶有附加選項的 Java PDF 到 HTML

Aspose.PDF for Java 還提供了額外的選項來自定義 PDF 到 HTML 的轉換。例如,您可以壓縮圖像、將輸出拆分為多個 HTML 頁面、為圖像指定文件夾等。以下是指定 PDF 到 HTML 轉換的其他選項的步驟。

以下代碼示例顯示瞭如何自定義 PDF 到 HTML 的轉換。

// 加載源 PDF 文檔
Document pdfDocument = new Document("PDFToHTML.pdf");

// 實例化 HTMLSaveOptions
HtmlSaveOptions htmlOptions = new HtmlSaveOptions();

// 將輸出拆分為多個頁面
htmlOptions.setSplitIntoPages(true);

// 將 PDF 文件另存為 HTML
pdfDocument.save("pdf-to-html.html", htmlOptions);

您可以使用以下文檔鏈接探索其他選項。

獲得免費許可證

您可以使用臨時許可證不受評估限制地使用 Aspose.PDF for Java。 立即購買

結論

在本文中,您學習瞭如何使用 Java 將 PDF 文件轉換為 HTML。此外,您還看到瞭如何使用不同的選項來自定義 PDF 到 HTML 的轉換。您可以使用 文檔 探索有關 API 的更多信息。此外,您可以將您的問題發佈到我們的論壇

也可以看看