스캐너나 카메라 장치의 사진을 사용하여 PDF 파일을 만드는 경우가 있습니다. 특정 상황에서는 PDF 파일의 텍스트 내용으로 작업할 수 있도록 스캔한 PDF 파일을 OCR을 사용하여 검색 가능한 PDF 파일로 변환해야 할 수 있습니다. 이에 따라 이 기사에서는 Java를 사용하여 프로그래밍 방식으로 OCR 기능을 통해 스캔한 PDF를 검색 가능한 PDF로 변환하는 방법을 다룹니다.
스캔한 PDF를 OCR로 검색 가능한 PDF로 변환 – Java API 설치
Aspose.OCR for Java API를 사용하여 OCR 기능으로 PDF 파일의 텍스트를 광학적으로 인식할 수 있습니다. New Releases 섹션에서 JAR 파일을 다운로드하거나 아래 Maven 사양을 사용하여 API를 설치하기만 하면 됩니다.
저장소:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
의존:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>21.12</version>
</dependency>
Java를 사용하여 프로그래밍 방식으로 스캔한 PDF를 검색 가능한 PDF로 변환
스캔한 PDF 파일의 내용을 OCR로 인식할 수 있습니다. 이를 통해 다음 단계에 따라 스캔한 PDF 파일을 검색 가능한 PDF 문서로 변환할 수 있습니다.
- AsposeOcr 클래스 개체를 만듭니다.
- RecognizePdf 방식으로 스캔한 PDF의 데이터를 인식합니다.
- DocumentRecognitionSettings 클래스를 사용하여 OCR 인식을 위한 페이지 번호를 설정합니다.
- 출력 OCR 결과를 검색 가능한 PDF 파일로 저장합니다.
다음 코드 조각은 스캔한 PDF를 Java에서 프로그래밍 방식으로 검색 가능한 PDF 파일로 변환하는 방법을 자세히 설명합니다.
// 스캔한 여러 페이지 PDF 경로
String fullPath = "multi_page.pdf";
// AsposeOcr 클래스 객체 초기화
AsposeOCRPdf api = new AsposeOCRPdf();
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);
// PDF에서 이미지 인식
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);
// 검색 가능한 PDF로 결과 저장
AsposeOCR.SaveMultipageDocument("output.pdf", Format.Pdf, res);
무료 평가판 라이선스 받기
임시 무료 라이선스를 신청하면 OCR 작업으로 스캔한 PDF의 텍스트를 제한 없이 인식하는 기능을 평가할 수 있습니다.
결론
이 기사에서는 Java에서 프로그래밍 방식으로 OCR 기능을 사용하여 스캔한 PDF 파일을 검색 가능한 PDF 문서로 변환하는 방법을 배웠습니다. 또한 문서를 방문하여 API의 다른 OCR 관련 기능을 살펴볼 수 있습니다. 우려 사항이 있는 경우 포럼에서 언제든지 저희에게 편지를 보내주십시오.