C#을 사용하여 OCR 수행

OCR(광학 문자 인식)은 이미지 및 스캔한 문서에서 텍스트를 인식하고 읽는 데 널리 사용되는 잘 알려져 있고 널리 사용되는 기술입니다. OCR 작업에서는 이미지의 문자를 스캔하고 인식하여 디지털 형식으로 변환합니다. 변환된 텍스트는 유효성을 검사하고 추가 작업을 수행하기 위해 저장할 수 있습니다. 이 기사에서는 .NET 응용 프로그램 내에서 C#을 사용하여 프로그래밍 방식으로 이미지를 텍스트로 변환하기 위해 OCR을 수행하는 방법을 보여줍니다. 기사의 나머지 부분은 다음 섹션으로 나뉩니다.

C# OCR 라이브러리 - 설치

Aspose.OCR for .NET은 이미지를 스캔하고 아주 쉽게 텍스트로 변환할 수 있는 강력한 OCR 라이브러리입니다. .NET 응용 프로그램 내에서 OCR 기능을 시작하고 실행하는 데 긴 코드가 필요하지 않습니다. 다음은 C# OCR 라이브러리의 설치 방법입니다.

NuGet 패키지 관리자를 통해 설치

NuGet 패키지 관리자에서 Aspose.OCR을 검색하고 설치하기만 하면 됩니다.

C# OCR 라이브러리

패키지 관리자 콘솔을 통해 설치

다음은 패키지 관리자 콘솔을 통해 Aspose.OCR을 설치하는 명령어입니다.

PM> Install-Package Aspose.OCR

C# OCR API를 사용하여 이미지를 텍스트로 변환

스캔한 문서의 페이지일 수 있는 이미지에 대해 OCR을 수행하는 방법을 살펴보겠습니다. 다음은 이 작업을 수행하는 단계입니다.

다음 코드 샘플은 C#을 사용하여 이미지를 텍스트로 변환하는 방법을 보여줍니다.

// 전체 예제 및 데이터 파일을 보려면 https://github.com/aspose-ocr/Aspose.OCR-for-.NET으로 이동하십시오.
// 문서 디렉토리의 경로입니다.
string dataDir = RunExamples.GetDataDir_OCR();

// AsposeOcr 인스턴스 초기화
AsposeOcr api = new AsposeOcr();

// 이미지 인식
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// 인식된 텍스트 표시
Console.WriteLine(result);

한 줄의 텍스트로 이미지에 OCR 수행

이전 예에서는 여러 줄의 텍스트가 포함된 이미지에 대해 OCR을 수행했습니다. 그러나 이미지에 텍스트가 한 줄만 포함되어 있을 수 있습니다. 이러한 경우 API에 행만 인식하도록 지시할 수 있습니다. 다음은 한 줄 텍스트가 포함된 이미지를 변환하는 단계입니다.

  • AsposeOcr 클래스의 객체를 생성합니다.
  • AsposeOcr.RecognizeLine(string) 메서드를 호출하여 이미지 파일의 경로를 전달합니다.
  • 결과를 문자열 개체로 가져옵니다.

다음 코드 샘플은 C#을 사용하여 OCR을 수행하고 한 줄의 텍스트가 포함된 이미지를 변환하는 방법을 보여줍니다.

// 전체 예제 및 데이터 파일을 보려면 https://github.com/aspose-ocr/Aspose.OCR-for-.NET으로 이동하십시오.
// 문서 디렉토리의 경로입니다.
string dataDir = RunExamples.GetDataDir_OCR();

// AsposeOcr 인스턴스 초기화
AsposeOcr api = new AsposeOcr();

// 이미지 인식
string result = api.RecognizeLine(dataDir + "sample_line.png");

// 인식된 텍스트 표시
Console.WriteLine(result);

영어가 아닌 문자에 대해 OCR 수행

Aspose.OCR은 영어의 OCR 기능을 제한하지 않으며 다른 언어의 문자도 인식할 수 있습니다. 인식 프로세스와 코드는 텍스트의 언어에 관계없이 동일하게 유지됩니다. 다음은 Aspose의 OCR API에서 인식할 수 있는 문자 집합입니다.

영어가 아닌 문자에 대한 OCR

결론

이 문서에서는 C#을 사용하여 프로그래밍 방식으로 OCR을 수행하고 이미지를 텍스트로 변환하는 방법을 보여주었습니다. 한 줄 또는 여러 줄의 텍스트가 포함된 이미지의 문자를 인식할 수 있습니다. 문서에서 C# OCR API에 대해 자세히 알아보세요.

또한보십시오