Java를 사용하여 OCR 수행

광학 문자 인식(OCR) 기술을 통해 스캔한 문서 및 이미지 내의 텍스트를 인식하고 읽을 수 있습니다. OCR을 사용하면 읽기 전용 텍스트를 편집 가능한 형식으로 변환할 수 있습니다. 변환된 텍스트는 텍스트 분석과 같은 작업을 위해 추가로 처리될 수 있습니다. 이 기사에서는 이미지(PNG, JPG, BMP, GIF)에 OCR을 수행하고 이미지를 텍스트로 변환하는 방법을 보여줍니다. Java OCR API 사용 - Java용 Aspose.OCR.

팁: 텍스트에서 애니메이션을 생성할 수 있는 무료 텍스트를 GIF로 변환하는 변환기에 관심이 있을 수 있습니다.

자바 OCR API - 설치

Aspose.OCR for Java는 JAR로 다운로드하거나 다음 구성을 사용하여 Maven 기반 애플리케이션 내에 설치할 수 있습니다.

저장소:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

의존:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Java를 사용하여 이미지를 텍스트로 변환

OCR의 이미지는 대부분 스캔한 문서, 송장, 영수증, 청구서 등의 페이지로 텍스트가 여러 줄로 구성되어 있습니다. 이러한 시나리오에서는 이미지에서 전체 텍스트를 검색해야 합니다. 다음은 Java용 Aspose.OCR을 사용하여 여러 줄의 텍스트가 있는 이미지에 대해 OCR을 수행하는 단계입니다.

  • AsposeOcr 클래스의 인스턴스를 만듭니다.
  • 이미지의 경로를 전달하여 AsposeOcr.recognizePage(String fullPath) 메서드를 사용하여 이미지를 텍스트로 변환합니다.
  • 변환된 텍스트를 문자열 개체로 가져옵니다.

다음 코드 샘플은 Java를 사용하여 이미지에 OCR을 수행하고 이미지를 텍스트로 변환하는 방법을 보여줍니다.

// 전체 예제 및 데이터 파일을 보려면 https://github.com/aspose-ocr/Aspose.OCR-for-Java로 이동하십시오.
// 문서 디렉토리의 경로입니다.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);

// 이미지 경로
String imagePath = dataDir + "p3.png";

//API 인스턴스 생성
AsposeOCR api = new AsposeOCR();

// 파일의 전체 경로로 페이지 인식
try {
	String result = api.RecognizePage(imagePath);
	System.out.println("Result: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

한 줄의 텍스트가 있는 이미지 변환

이전 예에서는 여러 줄의 텍스트가 있는 이미지에 대해 OCR을 수행했습니다. 그러나 이미지에 한 줄의 텍스트가 포함된 경우가 있을 수 있습니다. 이러한 경우에 따라 API를 구성할 수 있습니다. 다음은 한 줄의 텍스트가 있는 이미지를 변환하는 단계입니다.

다음 코드 샘플은 Java를 사용하여 한 줄의 텍스트가 있는 이미지에 대해 OCR을 수행하는 방법을 보여줍니다.

// 전체 예제 및 데이터 파일을 보려면 https://github.com/aspose-ocr/Aspose.OCR-for-Java로 이동하십시오.
// 문서 디렉토리의 경로입니다.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);

// 이미지 경로
String imagePath = dataDir + "0001460985.Jpeg";

//API 인스턴스 생성
AsposeOCR api = new AsposeOCR();

try {
	String result = api.RecognizeLine(imagePath);
	System.out.println("File: " + imagePath);
	System.out.println("Result line: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

결론

이 기사에서는 Java OCR API를 사용하여 PNG, JPG, BMP 및 GIF 이미지를 텍스트로 변환하는 방법을 살펴보았습니다. 코드 샘플은 Java 애플리케이션 내에서 한 줄 또는 여러 줄의 텍스트가 있는 이미지에서 OCR을 수행하는 방법을 보여줍니다. 문서를 사용하여 Aspose의 Java OCR API에 대해 자세히 알아볼 수 있습니다.

또한보십시오