使用Java從word文檔中提取圖片

圖像通常用於表示 Word DOC 文檔中的重要信息。在文本旁邊包含圖像使內容更具吸引力。在某些情況下,您可能需要以編程方式提取嵌入在 DOC 文檔中的圖像。為此,本文介紹瞭如何使用 Java 從 DOC 中提取圖像。

從 DOC 文件中提取圖像的 Java API

Aspose.Words for Java 是一個功能強大且功能豐富的 API,用於創建、操作和轉換 MS Word 文檔。因此,我們將使用此 API 從 DOC 文檔中提取圖像。您可以下載 API 的 JAR 或使用以下 Maven 配置將其安裝到您的 Java 應用程序中。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

如何在 Java 中從 DOC 中提取圖像

DOC 文檔中的圖像使用形狀對象表示。因此,要檢索圖像,您必須處理文檔中的每個形狀。以下是用 Java 從 DOC 文件中提取圖像的步驟。

以下代碼示例顯示瞭如何使用 Java 從 DOC 文檔中提取圖像。

// 加載Word文檔
Document doc = new Document("Document.docx");

// 獲取所有形狀
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;

// 循環遍歷形狀集合
for (Shape shape : shapes) {
  
    // 檢查形狀是否有圖像
    if (shape.hasImage()) {
      
        // 提取並保存圖像
        String imageFileName = String.format(
                "Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
        shape.getImageData().save(dataDir + imageFileName);
        imageIndex++;
    }
}

Java DOC 圖像提取器 - 獲得免費許可證

獲得免費的臨時許可證 在沒有評估限制的情況下使用 Aspose.Words for Java。

結論

在本文中,您學習瞭如何使用 Java 從 DOC 文檔中提取圖像。此外,代碼示例還展示瞭如何從 DOC 文件中提取圖像並將它們保存到所需位置。此外,Aspose.Words for Java 提供了廣泛的文檔操作功能。要探索這些功能,您可以訪問 文檔。此外,您可以通過我們的 論壇 提問。

也可以看看

信息:您可能對另一個 Java API(Aspose.Slides for Java)感興趣,它允許您將演示文稿(轉換為 PDF、word 文檔 等)和導入圖像 ] 或其他文檔轉換成演示文稿。