Word 到 HTML Java

為了將 Word 文檔的內容嵌入到您的應用程序中,您可能需要執行轉換。在這種情況下,最廣泛選擇的轉換是 Word 到 HTML 或 Word 到圖像。據此,本文介紹瞭如何使用 Java 將 Word DOCXDOC 文件轉換為 HTML。此外,我們還將討論如何將資源文件保存在單獨的文件夾中。

用於 Word 到 HTML 轉換的 Java API

對於 DOCX/DOC 到 HTML 的轉換,我們將使用 Aspose.Words for Java。它是一個強大的 API,用於在 Java 應用程序中實現文字處理功能。此外,API 提供了將 Word 文檔高保真地轉換為 HTML 和其他格式。您可以 下載 API 或從 Maven 安裝它。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.10</version>
    <type>pom</type>
</dependency>

在 Java 中將 Word 文檔轉換為 HTML

要將 Word 文檔轉換為 HTML,您只需加載文檔並將其另存為 HTML 文件。以下是使用 Java 將 Word DOCX 文件轉換為 HTML 的步驟。

以下代碼示例顯示瞭如何使用 Java 將 Word 文檔轉換為 HTML。

// 從磁盤加載文檔
Document doc = new Document("document.docx");

// 將文檔另存為 HTML
doc.save("Document_out.html", SaveFormat.HTML);

在 Word 到 HTML 轉換中指定資源文件夾

您還可以配置 API 以將資源文件保存在單獨的文件夾中。此外,您可以將字體和圖像分別保存在不同的文件夾中。以下是指定資源文件夾的步驟。

以下代碼示例在 Word 到 HTML 轉換中將資源文件保存在單獨的文件夾中。

// 載入文件
Document doc = new Document("Document.docx");

// 指定資源文件夾
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");

// 將 Word 文檔轉換為 HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);

您可以 閱讀更多 關於在 Word 到 HTML 轉換中使用資源文件夾的信息。

獲取免費的 API 許可證

通過獲得免費的臨時許可,您可以不受評估限制地使用 Aspose.Words for Java。

結論

在本文中,您學習瞭如何使用 Java 以編程方式將 Word DOCX 或 DOC 文件轉換為 HTML。除此之外,您還了解瞭如何在 Word 到 HTML 轉換中單獨存儲資源文件。此外,您可以使用 文檔 閱讀更多關於 Aspose.Words for Java 的信息。此外,您可以在我們的 論壇 上與我們分享您的疑問。

也可以看看