검색 가능한 PDF Java로 스캔

스캐너나 카메라 장치의 사진을 사용하여 PDF 파일을 만드는 경우가 있습니다. 특정 상황에서는 PDF 파일의 텍스트 내용으로 작업할 수 있도록 스캔한 PDF 파일을 OCR을 사용하여 검색 가능한 PDF 파일로 변환해야 할 수 있습니다. 이에 따라 이 기사에서는 Java를 사용하여 프로그래밍 방식으로 OCR 기능을 통해 스캔한 PDF를 검색 가능한 PDF로 변환하는 방법을 다룹니다.

스캔한 PDF를 OCR로 검색 가능한 PDF로 변환 – Java API 설치

Aspose.OCR for Java API를 사용하여 OCR 기능으로 PDF 파일의 텍스트를 광학적으로 인식할 수 있습니다. New Releases 섹션에서 JAR 파일을 다운로드하거나 아래 Maven 사양을 사용하여 API를 설치하기만 하면 됩니다.

저장소:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

의존:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

Java를 사용하여 프로그래밍 방식으로 스캔한 PDF를 검색 가능한 PDF로 변환

스캔한 PDF 파일의 내용을 OCR로 인식할 수 있습니다. 이를 통해 다음 단계에 따라 스캔한 PDF 파일을 검색 가능한 PDF 문서로 변환할 수 있습니다.

  1. AsposeOcr 클래스 개체를 만듭니다.
  2. RecognizePdf 방식으로 스캔한 PDF의 데이터를 인식합니다.
  3. DocumentRecognitionSettings 클래스를 사용하여 OCR 인식을 위한 페이지 번호를 설정합니다.
  4. 출력 OCR 결과를 검색 가능한 PDF 파일로 저장합니다.

다음 코드 조각은 스캔한 PDF를 Java에서 프로그래밍 방식으로 검색 가능한 PDF 파일로 변환하는 방법을 자세히 설명합니다.

// 스캔한 여러 페이지 PDF 경로
String fullPath = "multi_page.pdf";

// AsposeOcr 클래스 객체 초기화
AsposeOCRPdf api = new AsposeOCRPdf();

DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// PDF에서 이미지 인식           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// 검색 가능한 PDF로 결과 저장
AsposeOCR.SaveMultipageDocument("output.pdf", Format.Pdf, res);

무료 평가판 라이선스 받기

임시 무료 라이선스를 신청하면 OCR 작업으로 스캔한 PDF의 텍스트를 제한 없이 인식하는 기능을 평가할 수 있습니다.

결론

이 기사에서는 Java에서 프로그래밍 방식으로 OCR 기능을 사용하여 스캔한 PDF 파일을 검색 가능한 PDF 문서로 변환하는 방법을 배웠습니다. 또한 문서를 방문하여 API의 다른 OCR 관련 기능을 살펴볼 수 있습니다. 우려 사항이 있는 경우 포럼에서 언제든지 저희에게 편지를 보내주십시오.

또한보십시오