스캔한 PDF를 Excel OCR Java로

스캔한 PDF 파일은 스캐너에서 생성되는 경우가 많기 때문에 이미지 형식의 데이터를 구성합니다. 특정 상황에서는 스캔한 PDF 파일의 숫자 정보가 필요할 수 있습니다. 따라서 Excel 파일을 만들기 위한 OCR 작업을 수행할 수 있습니다. 이 문서에서는 Java에서 프로그래밍 방식으로 OCR 기능을 사용하여 스캔한 PDF를 Excel로 변환기를 만드는 방법을 다룹니다.

OCR을 사용하여 스캔한 PDF를 Excel로 변환기 만들기 – Java API 설치

Aspose.OCR for Java API를 사용하여 OCR 기능으로 PDF 파일의 텍스트를 광학적으로 인식할 수 있습니다. New Releases 섹션에서 JAR 파일을 다운로드하거나 아래 Maven 사양을 사용하여 API를 설치하기만 하면 됩니다.

저장소:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

의존:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

Java에서 프로그래밍 방식으로 스캔한 PDF를 Excel로 변환

아래 단계에 따라 스캔한 PDF 파일을 OCR을 사용하여 Excel로 변환할 수 있습니다.

  1. AsposeOcr 클래스 개체를 만듭니다.
  2. DocumentRecognitionSettings 클래스로 설정을 지정합니다.
  3. RecognizePdf 방식으로 스캔한 PDF 파일을 인식합니다.
  4. 출력 OCR 결과를 Excel 파일로 저장합니다.

다음 코드 조각은 Java에서 프로그래밍 방식으로 스캔한 PDF를 Excel 파일로 변환하는 방법을 자세히 설명합니다.

// 스캔한 PDF 파일 경로
String fullPath = "scanned.pdf";

// AsposeOcr 클래스 객체 초기화
AsposeOCRPdf api = new AsposeOCRPdf();

// DocumentRecognitionSettings 클래스 개체 초기화
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// PDF에서 이미지 인식           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// 결과를 Excel XLSX 파일로 저장
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);

무료 평가판 라이선스 받기

무료 임시 라이선스를 요청하면 OCR 작업으로 스캔한 PDF를 Excel로 변환하는 API를 제한 없이 평가할 수 있습니다.

결론

이 기사에서는 Java에서 프로그래밍 방식으로 OCR 기능을 사용하여 스캔한 PDF 파일을 Excel 파일로 변환하는 방법을 이해했습니다. 또한 문서를 방문하여 다른 OCR 관련 기능을 살펴보십시오. 우려 사항이 있는 경우 포럼에서 언제든지 저희에게 편지를 보내주십시오.

또한보십시오