使用 C++ 将 PDF 转换为 HTML

PDF 是一种标准文档格式,广泛用于个人和不同组织之间的文档交换。尽管它很受欢迎,但它可能并不总是展示内容的理想选择。例如,在网页上,HTML 是更令人满意的用户体验的更好选择。如果您想在网站上显示 PDF 内容,那么将其转换为 HTML 可能会很有帮助。有鉴于此,本文将教您如何使用C++将PDF文档转换为HTML格式。

用于将 PDF 文档转换为 HTML 格式的 C++ API

Aspose.PDF for C++ 是一个 C++ 库,允许您创建、阅读和更新 PDF 文档。此外,API 支持将 PDF 文件转换为 HTML 格式。您可以通过 NuGet 安装 API,也可以直接从 下载 部分下载。

PM> Install-Package Aspose.PDF.Cpp

使用 C++ 将 PDF 文档转换为 HTML 格式

使用 Aspose.PDF for C++ API 将 PDF 文档转换为 HTML 格式轻而易举。您只需两行代码即可执行转换。要将 PDF 文档转换为 HTML 格式,请按照以下步骤操作。

以下示例代码展示了如何使用 C++ 将 PDF 文档转换为 HTML 格式。

// 打开源 PDF 文档
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// 保存 HTML 文件
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);

源 PDF 文件

示例代码中使用的源 PDF 文件。

输出 HTML 文件

示例代码生成的输出 HTML 文件

使用 C++ 使用附加选项将 PDF 文档转换为 HTML 格式

Aspose.PDF for C++ API 让您能够自定义转换过程生成的 HTML。为此,API 提供了 HtmlSaveOptions 类。以下是 HtmlSaveOptions 类提供的一些选项。

以下是使用附加选项将 PDF 文档转换为 HTML 格式的步骤。

以下是演示使用 HtmlSaveOptions 类自定义 HTML 输出的 C++ 示例代码。

// 打开源 PDF 文档
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// 创建 HtmlSaveOptions 类的实例
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();

// 设置所需的选项
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;

// 保存 HTML 文件
pdfDocument->Save(u"OutputDirectory\\output.html", options);

获得免费许可证

您可以通过请求 免费的临时许可证 来试用该 API,而不受评估限制。

结论

在本文中,您学习了如何使用 C++ 将 PDF 文档转换为 HTML 格式。此外,您还学习了如何使用 Aspose.PDF for C++ API 提供的附加选项来自定义生成的 HTML。 API 提供了许多附加功能,用于自动执行与 PDF 相关的任务。您可以使用 官方文档 详细探索 API。如果您有任何问题,请随时通过 免费支持论坛 与我们联系。

也可以看看