PDF 是一種標准文檔格式,廣泛用於在個人和不同組織之間交換文檔。儘管它很受歡迎,但它可能並不總是顯示內容的理想選擇。例如,在網頁上,HTML 是更令人滿意的用戶體驗的更好選擇。如果您想在網站上顯示 PDF 內容,那麼將其轉換為 HTML 可能會有所幫助。鑑於此,本文將教您如何使用C++將PDF文檔轉換為HTML格式。
用於將 PDF 文檔轉換為 HTML 格式的 C++ API
Aspose.PDF for C++ 是一個 C++ 庫,允許您創建、閱讀和更新 PDF 文檔。此外,API 支持將 PDF 文件轉換為 HTML 格式。您可以通過 NuGet 安裝 API 或直接從 下載 部分下載。
PM> Install-Package Aspose.PDF.Cpp
使用 C++ 將 PDF 文檔轉換為 HTML 格式
使用 Aspose.PDF for C++ API 將 PDF 文檔轉換為 HTML 格式輕而易舉。您只需兩行代碼即可執行轉換。要將 PDF 文檔轉換為 HTML 格式,請按照以下步驟操作。
- 使用 Document 類加載 PDF 文檔。
- 使用 Document->Save(System::String outputFileName, SaveFormat format) 方法保存 HTML 輸出。
以下示例代碼顯示瞭如何使用 C++ 將 PDF 文檔轉換為 HTML 格式。
// 打開源 PDF 文檔
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");
// 保存 HTML 文件
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);
源 PDF 文件
輸出 HTML 文件
使用 C++ 使用附加選項將 PDF 文檔轉換為 HTML 格式
Aspose.PDF for C++ API 為您提供自定義轉換過程生成的 HTML 的能力。為此,API 提供了 HtmlSaveOptions 類。以下是 HtmlSaveOptions 類提供的一些選項。
- FontSavingMode:用於設置轉換時使用的字體保存模式。 FontSavingModes 枚舉用於設置其值。
- RasterImagesSavingMode:用於設置在轉換過程中應如何處理光柵圖像。 RasterImagesSavingModes 枚舉用於設置其值。
- LettersPositioningMethod:設置字母在單詞中的定位。 LettersPositioningMethods 枚舉用於設置其值。
- SpecialFolderForAllImages:用於設置圖片的保存路徑。
- SplitIntoPages:設置是將 PDF 的每一頁轉換為單獨的 HTML 頁面,還是將整個文檔轉換為單個 HTML 文件。
- SplitCssIntoPages:當SplitIntoPages設置為true時,SplitCssIntoPages設置是將CSS保存為單個文件還是為每個HTML頁面保存為單獨的文件。
以下是使用其他選項將 PDF 文檔轉換為 HTML 格式的步驟。
- 使用 Document 類加載 PDF 文檔。
- 創建 HtmlSaveOptions 類的實例。
- 設置所需的選項。
- 使用 Document->Save(System::String outputFileName, System::SharedPtr選項) 方法。
以下是演示如何使用 HtmlSaveOptions 類自定義 HTML 輸出的 C++ 示例代碼。
// 打開源 PDF 文檔
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");
// 創建 HtmlSaveOptions 類的實例
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();
// 設置所需的選項
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;
// 保存 HTML 文件
pdfDocument->Save(u"OutputDirectory\\output.html", options);
獲得免費許可證
您可以通過申請 免費的臨時許可證 來試用沒有評估限制的 API。
結論
在本文中,您學習瞭如何使用 C++ 將 PDF 文檔轉換為 HTML 格式。此外,您還學習瞭如何使用 Aspose.PDF for C++ API 提供的附加選項來自定義生成的 HTML。 API 提供了許多附加功能來自動執行與 PDF 相關的任務。您可以使用 官方文檔 詳細探索 API。如果您有任何疑問,請隨時通過 免費支持論壇 與我們聯繫。