為了將 Word 文檔的內容嵌入到您的應用程序中,您可能需要執行轉換。在這種情況下,最廣泛選擇的轉換是 Word 到 HTML 或 Word 到圖像。據此,本文介紹瞭如何使用 Java 將 Word DOCX 或 DOC 文件轉換為 HTML。此外,我們還將討論如何將資源文件保存在單獨的文件夾中。
用於 Word 到 HTML 轉換的 Java API
對於 DOCX/DOC 到 HTML 的轉換,我們將使用 Aspose.Words for Java。它是一個強大的 API,用於在 Java 應用程序中實現文字處理功能。此外,API 提供了將 Word 文檔高保真地轉換為 HTML 和其他格式。您可以 下載 API 或從 Maven 安裝它。
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.10</version>
<type>pom</type>
</dependency>
在 Java 中將 Word 文檔轉換為 HTML
要將 Word 文檔轉換為 HTML,您只需加載文檔並將其另存為 HTML 文件。以下是使用 Java 將 Word DOCX 文件轉換為 HTML 的步驟。
- 使用 Document 類加載 Word 文檔。
- 使用 Document.save(string, SaveFormat) 方法將 Word 文檔轉換為 HTML。
以下代碼示例顯示瞭如何使用 Java 將 Word 文檔轉換為 HTML。
// 從磁盤加載文檔
Document doc = new Document("document.docx");
// 將文檔另存為 HTML
doc.save("Document_out.html", SaveFormat.HTML);
在 Word 到 HTML 轉換中指定資源文件夾
您還可以配置 API 以將資源文件保存在單獨的文件夾中。此外,您可以將字體和圖像分別保存在不同的文件夾中。以下是指定資源文件夾的步驟。
- 使用 Document 類加載 Word 文檔。
- 創建 HtmlSaveOptions 類的對象。
- 使用 HtmlSaveOptions.setResourceFolder 方法設置資源文件夾。
- 使用 Document.save(string, HtmlSaveOptions) 方法將 Word 文檔轉換為 HTML。
以下代碼示例在 Word 到 HTML 轉換中將資源文件保存在單獨的文件夾中。
// 載入文件
Document doc = new Document("Document.docx");
// 指定資源文件夾
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");
// 將 Word 文檔轉換為 HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);
您可以 閱讀更多 關於在 Word 到 HTML 轉換中使用資源文件夾的信息。
獲取免費的 API 許可證
通過獲得免費的臨時許可,您可以不受評估限制地使用 Aspose.Words for Java。
結論
在本文中,您學習瞭如何使用 Java 以編程方式將 Word DOCX 或 DOC 文件轉換為 HTML。除此之外,您還了解瞭如何在 Word 到 HTML 轉換中單獨存儲資源文件。此外,您可以使用 文檔 閱讀更多關於 Aspose.Words for Java 的信息。此外,您可以在我們的 論壇 上與我們分享您的疑問。