PDF 是一种标准文档格式,广泛用于个人和不同组织之间的文档交换。尽管它很受欢迎,但它可能并不总是展示内容的理想选择。例如,在网页上,HTML 是更令人满意的用户体验的更好选择。如果您想在网站上显示 PDF 内容,那么将其转换为 HTML 可能会很有帮助。有鉴于此,本文将教您如何使用C++将PDF文档转换为HTML格式。
用于将 PDF 文档转换为 HTML 格式的 C++ API
Aspose.PDF for C++ 是一个 C++ 库,允许您创建、阅读和更新 PDF 文档。此外,API 支持将 PDF 文件转换为 HTML 格式。您可以通过 NuGet 安装 API,也可以直接从 下载 部分下载。
PM> Install-Package Aspose.PDF.Cpp
使用 C++ 将 PDF 文档转换为 HTML 格式
使用 Aspose.PDF for C++ API 将 PDF 文档转换为 HTML 格式轻而易举。您只需两行代码即可执行转换。要将 PDF 文档转换为 HTML 格式,请按照以下步骤操作。
- 使用 Document 类加载 PDF 文档。
- 使用 Document->Save(System::String outputFileName, SaveFormat format) 方法保存 HTML 输出。
以下示例代码展示了如何使用 C++ 将 PDF 文档转换为 HTML 格式。
// 打开源 PDF 文档
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");
// 保存 HTML 文件
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);
源 PDF 文件
输出 HTML 文件
使用 C++ 使用附加选项将 PDF 文档转换为 HTML 格式
Aspose.PDF for C++ API 让您能够自定义转换过程生成的 HTML。为此,API 提供了 HtmlSaveOptions 类。以下是 HtmlSaveOptions 类提供的一些选项。
- FontSavingMode:用于设置转换时使用的字体保存模式。 FontSavingModes 枚举用于设置其值。
- RasterImagesSavingMode:用于设置在转换过程中应如何处理光栅图像。 RasterImagesSavingModes 枚举用于设置其值。
- LettersPositioningMethod:设置单词中字母的位置。 LettersPositioningMethods 枚举用于设置其值。
- SpecialFolderForAllImages:用于设置图片的保存路径。
- SplitIntoPages:设置 PDF 的每一页是否应转换为单独的 HTML 页面或整个文档应转换为单个 HTML 文件。
- SplitCssIntoPages:当 SplitIntoPages 设置为 true 时,SplitCssIntoPages 设置 CSS 应保存为单个文件还是每个 HTML 页面的单独文件。
以下是使用附加选项将 PDF 文档转换为 HTML 格式的步骤。
- 使用 Document 类加载 PDF 文档。
- 创建 HtmlSaveOptions 类的实例。
- 设置所需的选项。
- 使用 Document->Save(System::String outputFileName, System::SharedPtr) 保存 HTML 输出选项) 方法。
以下是演示使用 HtmlSaveOptions 类自定义 HTML 输出的 C++ 示例代码。
// 打开源 PDF 文档
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");
// 创建 HtmlSaveOptions 类的实例
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();
// 设置所需的选项
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;
// 保存 HTML 文件
pdfDocument->Save(u"OutputDirectory\\output.html", options);
获得免费许可证
您可以通过请求 免费的临时许可证 来试用该 API,而不受评估限制。
结论
在本文中,您学习了如何使用 C++ 将 PDF 文档转换为 HTML 格式。此外,您还学习了如何使用 Aspose.PDF for C++ API 提供的附加选项来自定义生成的 HTML。 API 提供了许多附加功能,用于自动执行与 PDF 相关的任务。您可以使用 官方文档 详细探索 API。如果您有任何问题,请随时通过 免费支持论坛 与我们联系。