圖像通常用於表示 Word DOC 文檔中的重要信息。在文本旁邊包含圖像使內容更具吸引力。在某些情況下,您可能需要以編程方式提取嵌入在 DOC 文檔中的圖像。為此,本文介紹瞭如何使用 Java 從 DOC 中提取圖像。
從 DOC 文件中提取圖像的 Java API
Aspose.Words for Java 是一個功能強大且功能豐富的 API,用於創建、操作和轉換 MS Word 文檔。因此,我們將使用此 API 從 DOC 文檔中提取圖像。您可以下載 API 的 JAR 或使用以下 Maven 配置將其安裝到您的 Java 應用程序中。
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
如何在 Java 中從 DOC 中提取圖像
DOC 文檔中的圖像使用形狀對象表示。因此,要檢索圖像,您必須處理文檔中的每個形狀。以下是用 Java 從 DOC 文件中提取圖像的步驟。
- 首先,使用 Document 類加載 DOC 文件。
- 然後,將所有形狀放入 NodeCollection 對象使用 Document.getChildNodes(NodeType.SHAPE, Boolean) 方法。
- 循環遍歷檢索到的形狀。
- 在每次迭代中,使用 Shape.hasImage() 方法檢查形狀是否有圖像。
- 最後,提取圖像並使用 Shape.getImageData().save(string) 方法保存。
以下代碼示例顯示瞭如何使用 Java 從 DOC 文檔中提取圖像。
// 加載Word文檔
Document doc = new Document("Document.docx");
// 獲取所有形狀
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;
// 循環遍歷形狀集合
for (Shape shape : shapes) {
// 檢查形狀是否有圖像
if (shape.hasImage()) {
// 提取並保存圖像
String imageFileName = String.format(
"Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
shape.getImageData().save(dataDir + imageFileName);
imageIndex++;
}
}
Java DOC 圖像提取器 - 獲得免費許可證
獲得免費的臨時許可證 在沒有評估限制的情況下使用 Aspose.Words for Java。
結論
在本文中,您學習瞭如何使用 Java 從 DOC 文檔中提取圖像。此外,代碼示例還展示瞭如何從 DOC 文件中提取圖像並將它們保存到所需位置。此外,Aspose.Words for Java 提供了廣泛的文檔操作功能。要探索這些功能,您可以訪問 文檔。此外,您可以通過我們的 論壇 提問。
也可以看看
信息:您可能對另一個 Java API(Aspose.Slides for Java)感興趣,它允許您將演示文稿(轉換為 PDF、word 文檔 等)和導入圖像 ] 或其他文檔轉換成演示文稿。