使用 C++ 將 PDF 轉換為 HTML

PDF 是一種標准文檔格式,廣泛用於在個人和不同組織之間交換文檔。儘管它很受歡迎,但它可能並不總是顯示內容的理想選擇。例如,在網頁上,HTML 是更令人滿意的用戶體驗的更好選擇。如果您想在網站上顯示 PDF 內容,那麼將其轉換為 HTML 可能會有所幫助。鑑於此,本文將教您如何使用C++將PDF文檔轉換為HTML格式。

用於將 PDF 文檔轉換為 HTML 格式的 C++ API

Aspose.PDF for C++ 是一個 C++ 庫,允許您創建、閱讀和更新 PDF 文檔。此外,API 支持將 PDF 文件轉換為 HTML 格式。您可以通過 NuGet 安裝 API 或直接從 下載 部分下載。

PM> Install-Package Aspose.PDF.Cpp

使用 C++ 將 PDF 文檔轉換為 HTML 格式

使用 Aspose.PDF for C++ API 將 PDF 文檔轉換為 HTML 格式輕而易舉。您只需兩行代碼即可執行轉換。要將 PDF 文檔轉換為 HTML 格式,請按照以下步驟操作。

以下示例代碼顯示瞭如何使用 C++ 將 PDF 文檔轉換為 HTML 格式。

// 打開源 PDF 文檔
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// 保存 HTML 文件
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);

源 PDF 文件

示例代碼中使用的源 PDF 文件。

輸出 HTML 文件

示例代碼生成的輸出 HTML 文件

使用 C++ 使用附加選項將 PDF 文檔轉換為 HTML 格式

Aspose.PDF for C++ API 為您提供自定義轉換過程生成的 HTML 的能力。為此,API 提供了 HtmlSaveOptions 類。以下是 HtmlSaveOptions 類提供的一些選項。

以下是使用其他選項將 PDF 文檔轉換為 HTML 格式的步驟。

以下是演示如何使用 HtmlSaveOptions 類自定義 HTML 輸出的 C++ 示例代碼。

// 打開源 PDF 文檔
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// 創建 HtmlSaveOptions 類的實例
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();

// 設置所需的選項
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;

// 保存 HTML 文件
pdfDocument->Save(u"OutputDirectory\\output.html", options);

獲得免費許可證

您可以通過申請 免費的臨時許可證 來試用沒有評估限制的 API。

結論

在本文中,您學習瞭如何使用 C++ 將 PDF 文檔轉換為 HTML 格式。此外,您還學習瞭如何使用 Aspose.PDF for C++ API 提供的附加選項來自定義生成的 HTML。 API 提供了許多附加功能來自動執行與 PDF 相關的任務。您可以使用 官方文檔 詳細探索 API。如果您有任何疑問,請隨時通過 免費支持論壇 與我們聯繫。

也可以看看