PDF 转 HTML Java

您可能经常需要将 PDF 文件转换为 HTML 以将其嵌入网页中。为了以编程方式执行此转换,本文介绍了如何使用 Java 将 PDF 文件转换为 HTML。此外,您将学习如何使用附加选项来自定义 PDF 到 HTML 的转换。

用于 PDF 到 HTML 转换的 Java API

为了将 PDF 文件转换为 HTML,我们将使用 Aspose.PDF for Java。它是一个功能丰富的 PDF 操作 API,可让您生成、修改和转换 PDF 文件。此外,它提供了易于使用的方法将 PDF 转换为 HTML 页面。您可以 下载 API 或使用以下 Maven 配置安装它。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>21.5</version>
</dependency>

在 Java 中将 PDF 转换为 HTML

以下是使用 Java 将 PDF 文件转换为 HTML 的步骤。

以下代码示例显示了如何将 PDF 文件转换为 HTML。

// 加载源 PDF 文档
Document pdfDocument = new Document("PDFToHTML.pdf");

// 将 PDF 文件另存为 HTML
pdfDocument.save("pdf-to-html.html", SaveFormat.Html);

带有附加选项的 Java PDF 到 HTML

Aspose.PDF for Java 还提供了额外的选项来自定义 PDF 到 HTML 的转换。例如,您可以压缩图像、将输出拆分为多个 HTML 页面、为图像指定文件夹等。以下是指定 PDF 到 HTML 转换的附加选项的步骤。

以下代码示例显示了如何自定义 PDF 到 HTML 的转换。

// 加载源 PDF 文档
Document pdfDocument = new Document("PDFToHTML.pdf");

// 实例化 HTMLSaveOptions
HtmlSaveOptions htmlOptions = new HtmlSaveOptions();

// 将输出拆分为多个页面
htmlOptions.setSplitIntoPages(true);

// 将 PDF 文件另存为 HTML
pdfDocument.save("pdf-to-html.html", htmlOptions);

您可以使用以下文档链接探索其他选项。

获得免费许可证

您可以使用临时许可证使用 Aspose.PDF for Java,而不受评估限制。 立即获取

结论

在本文中,您学习了如何使用 Java 将 PDF 文件转换为 HTML。此外,您还了解了如何使用不同的选项来自定义 PDF 到 HTML 的转换。您可以使用 文档 探索有关 API 的更多信息。此外,您可以将您的查询发布到我们的 论坛

也可以看看