Java를 사용하여 워드 문서에서 이미지 추출

이미지는 일반적으로 Word 문서에서 중요한 정보를 나타내는 데 사용됩니다. 텍스트와 함께 이미지를 포함하면 콘텐츠가 더 매력적입니다. 어떤 경우에는 프로그래밍 방식으로 Word 문서에 포함된 이미지를 추출해야 할 수도 있습니다. 이를 달성하기 위해 이 기사에서는 Java를 사용하여 Word 문서에서 이미지를 추출하는 방법을 다룹니다.

Word 문서에서 이미지를 추출하는 Java API

Aspose.Words for Java는 MS Word 문서를 생성, 조작 및 변환하기 위한 강력하고 기능이 풍부한 API입니다. 따라서 이 API를 사용하여 MS Word DOCX/DOC 문서에서 이미지를 추출합니다. API의 JAR을 다운로드하거나 다음 Maven 구성을 사용하여 Java 애플리케이션에 설치할 수 있습니다.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Word 문서에서 이미지를 추출하는 방법

Word 문서의 이미지는 모양 개체를 사용하여 표현됩니다. 따라서 이미지를 검색하려면 문서의 모든 모양을 처리해야 합니다. 다음은 Java에서 Word DOCX 문서에서 이미지를 추출하는 단계입니다.

다음 코드 샘플은 Java의 DOCX 문서에서 이미지를 추출하는 방법을 보여줍니다.

// Word 문서 로드
Document doc = new Document("Document.docx");

// 모든 모양 가져오기
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;

// 모양 컬렉션 반복
for (Shape shape : shapes) {
  
    // 모양에 이미지가 있는지 확인
    if (shape.hasImage()) {
      
        // 이미지 추출 및 저장
        String imageFileName = String.format(
                "Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
        shape.getImageData().save(dataDir + imageFileName);
        imageIndex++;
    }
}

무료 API 라이선스 받기

평가 제한 없이 Java용 Aspose.Words를 사용하려면 무료 임시 라이선스 받기.

결론

이 기사에서는 Java를 사용하여 Word 문서에서 이미지를 추출하는 방법을 배웠습니다. 또한 코드 샘플은 DOCX 파일에서 이미지를 추출하여 원하는 위치에 저장하는 방법을 보여주었습니다. 게다가 Aspose.Words for Java는 문서 조작을 위한 광범위한 기능을 제공합니다. 이러한 기능을 탐색하려면 문서를 방문하십시오. 또한 포럼을 통해 질문할 수 있습니다.

또한보십시오

정보: 프레젠테이션(PDF, 단어 문서 등으로) 및 [이미지 가져오기][11로 변환할 수 있는 다른 Java API(Aspose.Slides for Java)에 관심이 있을 수 있습니다. ] 또는 기타 문서를 프레젠테이션으로 변환합니다.