HTML 格式之所以流行,是因為幾乎所有計算機環境都支持它。 WORD 到 HTML 或 MHTML 的轉換在需要使用 C++ 在 Web 應用程序中顯示此類文件等情況下很有用。 Aspose.Words for C++ API 因其特性和效率而成為最佳選擇。您可以通過將 Microsoft Word 文件 (DOC/DOCX) 轉換為 HTML 或 MHTML 格式的功能來豐富您的 C++ 應用程序。以下是本文的大綱,我們將在其中詳細探討 Word 轉換:

C++ Microsoft Word 文件轉換器 API – 安裝

我們需要安裝 Aspose.Words for C++ API 來轉換 Microsoft Word (DOCX/DOC) 文件。您可以從 NuGet 庫輕鬆安裝 API,或在控制台上使用以下命令安裝它。

Install-Package Aspose.Words.Cpp -Version 20.8.0

使用 C++ 將 Word (DOCX/DOC) 轉換為 HTML

當您想要呈現內容以便在瀏覽器中顯示時,Word 到 HTML 的轉換很有用。您的 C++ 應用程序可以通過以下步驟快速執行轉換:

  1. 加載源字文件
  2. 以 HTML 格式保存文檔

下面的代碼顯示瞭如何使用 C++ 將 word 轉換為 HTML:

// 從中加載文檔
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// 將word文檔保存為HTML格式
doc->Save(u"Document_out.html", SaveFormat::Html);

使用 C++ 將 Word 轉換為帶有嵌入式字體的 HTML

word 文件 (DOCX/DOC) 可能包含某些平台可能不支持的自定義字體。在這種情況下,字體在輸出結果中可能會出現亂碼。但是,Aspose.Words for C++ API 允許您使用 Base64 編碼將字體資源嵌入到 HTML 中。您可以設置 ExportFontsAsBase64 屬性,該屬性將在輸出 HTML 文件中嵌入字體。您需要按照以下步驟來實現這些要求:

  1. 加載源 DOCX 文件
  2. 設置 ExportFontsAsBase64 屬性
  3. 保存輸出的 HTML 文件

以下代碼片段顯示瞭如何使用 C++ 將 Word 轉換為帶有嵌入式字體的 HTML:

// 加載源 DOCX 文件
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// 初始化 HtmlSaveOptions 對象
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// 保存輸出 HTML
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

此外,如果您使用記事本編輯 HTML 文件,或在瀏覽器中查看源代碼,您會注意到文件中嵌入了 Base64 字體。以下屏幕截圖顯示了輸出 HTML 文件的示例:

將 Word 轉換為 HTML

使用 C++ 中的往返信息將 Word 轉換為 HTML

Microsoft Word 文檔可以包含很多信息和功能,否則 HTML 文件格式將不支持這些信息和功能。有時您需要將 Word 轉換為 HTML,然後再轉換回 Word 格式。為了確保這些轉換之間的最大保真度,一些被稱為“往返信息”的信息可以由 Aspose.Words for C++ API 額外保存。讓我們按照以下步驟來測試這樣的轉換:

  1. 加載源 DOCX 文件
  2. ExportRoundtripInformation 設置為 true
  3. 保存輸出的 HTML 文件

下面的代碼片段顯示瞭如何使用 C++ 將 Word 轉換為帶有往返信息的 HTML:

// 加載輸入 DOCX 文件
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// 設置 HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// 保存輸出 HTML 文件        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

在 C++ 中將 Word 轉換為 MHTML

MHTML 文件格式很受歡迎,因為它包含單個輸出文件中的所有內容。您可以使用 C++ 通過以下步驟將 Word 文件 (DOCX/DOC) 轉換為 MHTML 格式:

  1. 加載源 DOCX 文件
  2. 以 MHTML 格式保存輸出

下面的代碼片段顯示瞭如何使用 C++ 將 Word 轉換為 MHTML:

// 將文檔加載到 Aspose.Words 中。
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// 以 MHTML 格式保存輸出。
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

結論

我們已經學習瞭如何使用不同的選項將 Word (DOCX/DOC) 轉換為 HTML 或 MHTML。還詳細討論了一些功能,例如保存往返信息或將字體嵌入為 Base64 資源。但是,如有任何疑問,請隨時通過 免費支持論壇 與我們聯繫。

也可以看看