PDF 파일을 구문 분석하는 동안 문서에서 텍스트와 함께 이미지를 추출해야 할 수도 있습니다. 이 작업을 프로그래밍 방식으로 수행하기 위해 이 기사에서는 Java의 PDF 문서에서 이미지를 추출하는 방법을 다룹니다. API 참조 및 코드 샘플과 함께 단계별 가이드는 전체 이미지 추출 절차를 보여줍니다.
PDF에서 이미지를 추출하는 Java API - 무료 다운로드
PDF에서 이미지를 추출하기 위해 Aspose.PDF for Java를 사용합니다. PDF 파일을 만들고 처리하기 위한 다양한 기능을 제공하는 강력한 PDF 조작 API입니다. API를 다운로드하거나 다음 Maven 구성을 사용하여 설치할 수 있습니다.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Java에서 PDF에서 이미지 추출
다음은 Java를 사용하여 PDF 문서에서 이미지를 추출하는 단계입니다.
- Document 클래스를 사용하여 PDF 문서를 로드합니다.
- Document.getPages() 메서드에서 반환된 문서의 페이지 컬렉션을 반복합니다.
- 각 Page에 대해 Page.getResources().getImages() 메서드를 사용하여 XImage 컬렉션을 반복합니다.
- 각 이미지를 저장할 FileOutputStream 객체를 생성합니다.
다음 코드 샘플은 PDF 문서에서 이미지를 추출하는 방법을 보여줍니다.
// PDF 문서 로드
Document pdfDocument = new Document("ImagetoPDF.pdf");
// 페이지 반복
for (Page page : pdfDocument.getPages()) {
int imageCounter = 1;
// 이미지 반복
for (XImage xImage : page.getResources().getImages()) {
try {
// 파일 스트림 생성
java.io.FileOutputStream outputImage = new java.io.FileOutputStream(
page.getNumber() + "_" + imageCounter + ".jpg");
// 출력 이미지 저장
xImage.save(outputImage);
// 스트림 닫기
outputImage.close();
} catch (java.io.FileNotFoundException e) {
// TODO: 예외 처리
e.printStackTrace();
} catch (java.io.IOException e) {
// TODO: 예외 처리
e.printStackTrace();
}
imageCounter++;
}
// 카운터 재설정
imageCounter=1;
}
Java PDF 이미지 추출기 - 무료 라이선스 받기
임시 라이선스를 사용하여 평가 제한 없이 Java용 Aspose.PDF를 사용할 수 있습니다.
결론
다양한 경우에 PDF 문서에서 이미지를 추출해야 합니다. 이를 달성하기 위해 이 기사에서는 Java의 PDF 파일에서 이미지를 추출하는 방법을 배웠습니다. 문서를 사용하여 Java PDF API에 대해 자세히 알아볼 수 있습니다. 또한 포럼에 질문을 게시할 수 있습니다.