OCR(광학 문자 인식)은 이미지 및 스캔한 문서에서 텍스트를 인식하고 읽는 데 널리 사용되는 잘 알려져 있고 널리 사용되는 기술입니다. OCR 작업에서는 이미지의 문자를 스캔하고 인식하여 디지털 형식으로 변환합니다. 변환된 텍스트는 유효성을 검사하고 추가 작업을 수행하기 위해 저장할 수 있습니다. 이 기사에서는 .NET 응용 프로그램 내에서 C#을 사용하여 프로그래밍 방식으로 이미지를 텍스트로 변환하기 위해 OCR을 수행하는 방법을 보여줍니다. 기사의 나머지 부분은 다음 섹션으로 나뉩니다.
C# OCR 라이브러리 - 설치
Aspose.OCR for .NET은 이미지를 스캔하고 아주 쉽게 텍스트로 변환할 수 있는 강력한 OCR 라이브러리입니다. .NET 응용 프로그램 내에서 OCR 기능을 시작하고 실행하는 데 긴 코드가 필요하지 않습니다. 다음은 C# OCR 라이브러리의 설치 방법입니다.
NuGet 패키지 관리자를 통해 설치
NuGet 패키지 관리자에서 Aspose.OCR을 검색하고 설치하기만 하면 됩니다.
패키지 관리자 콘솔을 통해 설치
다음은 패키지 관리자 콘솔을 통해 Aspose.OCR을 설치하는 명령어입니다.
PM> Install-Package Aspose.OCR
C# OCR API를 사용하여 이미지를 텍스트로 변환
스캔한 문서의 페이지일 수 있는 이미지에 대해 OCR을 수행하는 방법을 살펴보겠습니다. 다음은 이 작업을 수행하는 단계입니다.
- AsposeOcr 클래스의 인스턴스를 만듭니다.
- 이미지의 경로를 전달하여 AsposeOcr.RecognizeImage(string) 메서드를 호출하고 결과를 문자열 개체로 가져옵니다.
다음 코드 샘플은 C#을 사용하여 이미지를 텍스트로 변환하는 방법을 보여줍니다.
// 전체 예제 및 데이터 파일을 보려면 https://github.com/aspose-ocr/Aspose.OCR-for-.NET으로 이동하십시오.
// 문서 디렉토리의 경로입니다.
string dataDir = RunExamples.GetDataDir_OCR();
// AsposeOcr 인스턴스 초기화
AsposeOcr api = new AsposeOcr();
// 이미지 인식
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");
// 인식된 텍스트 표시
Console.WriteLine(result);
한 줄의 텍스트로 이미지에 OCR 수행
이전 예에서는 여러 줄의 텍스트가 포함된 이미지에 대해 OCR을 수행했습니다. 그러나 이미지에 텍스트가 한 줄만 포함되어 있을 수 있습니다. 이러한 경우 API에 행만 인식하도록 지시할 수 있습니다. 다음은 한 줄 텍스트가 포함된 이미지를 변환하는 단계입니다.
- AsposeOcr 클래스의 객체를 생성합니다.
- AsposeOcr.RecognizeLine(string) 메서드를 호출하여 이미지 파일의 경로를 전달합니다.
- 결과를 문자열 개체로 가져옵니다.
다음 코드 샘플은 C#을 사용하여 OCR을 수행하고 한 줄의 텍스트가 포함된 이미지를 변환하는 방법을 보여줍니다.
// 전체 예제 및 데이터 파일을 보려면 https://github.com/aspose-ocr/Aspose.OCR-for-.NET으로 이동하십시오.
// 문서 디렉토리의 경로입니다.
string dataDir = RunExamples.GetDataDir_OCR();
// AsposeOcr 인스턴스 초기화
AsposeOcr api = new AsposeOcr();
// 이미지 인식
string result = api.RecognizeLine(dataDir + "sample_line.png");
// 인식된 텍스트 표시
Console.WriteLine(result);
영어가 아닌 문자에 대해 OCR 수행
Aspose.OCR은 영어의 OCR 기능을 제한하지 않으며 다른 언어의 문자도 인식할 수 있습니다. 인식 프로세스와 코드는 텍스트의 언어에 관계없이 동일하게 유지됩니다. 다음은 Aspose의 OCR API에서 인식할 수 있는 문자 집합입니다.
결론
이 문서에서는 C#을 사용하여 프로그래밍 방식으로 OCR을 수행하고 이미지를 텍스트로 변환하는 방법을 보여주었습니다. 한 줄 또는 여러 줄의 텍스트가 포함된 이미지의 문자를 인식할 수 있습니다. 문서에서 C# OCR API에 대해 자세히 알아보세요.