在 Java 中將 HTML 文件轉換為 Word DOCX DOC

在各種情況下,您可能需要將 HTML 內容轉換為 Word 文檔。例如,用於從 WYSIWYG HTML 編輯器生成文檔或將網頁轉換為 DOCX 或 DOC 格式。為了以編程方式執行此轉換,本文介紹瞭如何將 HTML 文件轉換為 Word DOCXDOCDOCM 或 Java 中的其他格式。

將 HTML 轉換為 Word 的 Java 庫

要將 HTML 轉換為 DOCX、DOC、DOT、DOCM 和其他 Word 格式,我們將使用 Aspose.Words for Java。它是一個以編程方式創建和操作 Word 文檔的強大庫。此外,它還提供了一個內置的文檔轉換器,可以提供字處理文檔的高保真轉換。您可以從 下載部分 下載 API 的 JAR 或使用 pom.xml 中的以下 Maven 配置安裝它。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

在 Java 中將 HTML 轉換為 DOCX/DOC/DOCM

使用 Aspose.Words for Java,將 HTML 文件轉換為 Word 格式可以通過幾個步驟完成,如下所述。

Document.save() 方法中的 SaveFormat 枚舉指定了要轉換 HTML 文件的格式。以下代碼示例顯示瞭如何在 Java 中從 HTML 生成 Word 文檔。

// 使用 Document 類加載 HTML 文件
Document document = new Document("template.html");

// 將 HTML 文件轉換為 Word DOCX 格式
document.save("output.docx", SaveFormat.DOCX); 

在 Java 中使用 URL 將網頁轉換為 Word

您還可以直接從網頁的 URL 將網頁轉換為 Word 文檔。以下是在 Java 中使用 URL 將 HTML 轉換為 DOCX 的步驟。

以下代碼示例顯示如何使用 URL 將網頁轉換為 Word 文檔。

// 創建和初始化 URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// 獲取網頁作為輸入流
InputStream is = oracleURL.openStream();

// 初始化 HTML 加載選項
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// 將流加載到 Document 對像中
Document doc = new Document(is, htmloptions);

// 另存為 DOCX
doc.save("output.docx", SaveFormat.DOCX);

使用 Java 將 HTML 字符串轉換為 Word

Aspose.Words for Java 還允許您從 HTML 字符串動態生成 Word 文檔。以下是執行此操作的步驟。

以下代碼示例顯示瞭如何使用 Java 將 HTML 字符串轉換為 DOCX 文件。

// 創建一個新文檔
Document doc = new Document();

// 創建文檔生成器
DocumentBuilder builder = new DocumentBuilder(doc);

// 插入 HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// 另存為 DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

獲取免費的 API 許可證

通過獲得免費的臨時許可,您可以不受評估限制地使用 Aspose.Words for Java。

結論

在本文中,您學習瞭如何使用 Java 以編程方式將 HTML 文件轉換為 Word DOCX、DOC、DOCM 或其他格式。此外,您還了解瞭如何將 HTML 字符串或網頁從 URL 動態轉換為 Word 文檔。您可以簡單地安裝 Aspose.Words for Java 並使用提供的代碼來構建您的 HTML 到 Word 轉換器。此外,您可以訪問文檔來探索更多關於Aspose.Words for Java的信息。此外,您可以在我們的 論壇 上與我們分享您的疑問。

也可以看看

信息:如果您需要從 PowerPoint 演示文稿中獲取 Word 文檔,您可以使用 Aspose Presentation to Word Document 轉換器。