C#에서 OCR 이미지를 텍스트로 및 맞춤법 수정

이미지나 스캔한 문서에서 OCR을 수행하고 C#을 사용하여 프로그래밍 방식으로 텍스트 데이터를 추출할 수 있습니다. 그런 다음 맞춤법 검사기를 실행하여 인식된 텍스트의 맞춤법 오류를 수정할 수 있습니다. 이 기사에서는 C#에서 OCR 이미지를 텍스트로 변환하고 맞춤법을 수정하는 방법을 배웁니다.

이 기사에서는 다음 주제를 다룹니다.

  1. OCR 이미지를 텍스트 및 맞춤법 수정 C# API로
  2. OCR 이미지를 텍스트로 변환하고 맞춤법 오류 발생
  3. 맞춤법 수정으로 이미지를 텍스트로 변환
  4. 인식된 텍스트를 철자를 수정하여 저장
  5. 맞춤법 검사 맞춤 텍스트

OCR 이미지에서 텍스트 및 맞춤법 수정 C# API

Aspose.OCR for .NET API를 사용하여 이미지, 텍스트 추출 및 맞춤법 수정에 대한 OCR을 수행합니다. 스캔한 이미지, 스마트폰 사진, 스크린샷, 이미지 영역, 스캔한 PDF를 인식할 수 있습니다. 가장 널리 사용되는 문서 및 데이터 교환 형식으로 인식된 텍스트 결과를 반환합니다. API를 사용하면 이미지를 텍스트로 변환하고 스캔에서 검색 가능한 PDF를 생성할 수도 있습니다. 또한 인식된 텍스트의 철자 오류를 자동으로 수정할 수 있습니다.

AsposeOcr 클래스는 Aspose OCR 라이브러리의 기본 API입니다. OCR 작업을 수행하는 다양한 방법을 제공합니다. 이 클래스의 RecognizeImage() 메서드는 지원되는 형식의 이미지에 있는 텍스트를 인식합니다. API의 CorrectSpelling() 메소드는 철자가 틀린 단어를 텍스트에서 올바른 단어로 대체합니다. RecognitionResult 클래스는 이미지 인식 결과를 나타냅니다. 이 클래스의 Save(string, SaveFormat, bool, SpellCheckLanguage, string) 메서드는 문서를 일반 텍스트, PDF 또는 Microsoft Word 문서로 저장합니다. 맞춤법 검사를 지원하는 모든 언어는 SpellCheckLanguage 열거형에 정의되어 있습니다.

API의 DLL을 다운로드하거나 NuGet을 사용하여 설치하십시오.

PM> Install-Package Aspose.OCR

OCR 이미지를 텍스트로 변환하고 C#에서 철자 오류를 가져옵니다.

아래 단계에 따라 이미지에 OCR을 수행하고 인식된 텍스트의 철자 오류 목록을 가져올 수 있습니다.

  1. 먼저 AsposeOcr 클래스의 인스턴스를 만듭니다.
  2. 다음으로 RecognitionSettings 클래스의 개체를 초기화합니다.
  3. 그런 다음 RecognizeImage() 메서드를 호출하여 RecognitionResult를 가져옵니다. 이미지 경로와 RecognitionSettings 개체를 인수로 사용합니다.
  4. 그런 다음 GetSpellCheckErrorList() 메서드를 호출하여 추천과 함께 철자가 틀린 단어 목록을 가져옵니다.
  5. 마지막으로 SpellCheckError 목록을 반복하고 결과를 표시합니다.

다음 샘플 코드는 C#에서 인식된 텍스트에서 맞춤법 오류 목록을 가져오는 방법을 보여줍니다.

// 이 코드 예제는 인식된 텍스트에서 철자가 틀린 단어 목록을 가져오는 방법을 보여줍니다.
// 인식할 이미지의 경로
string imagePath = @"C:\Files\OCR\sample.png";

// OCR API 생성
AsposeOcr api = new AsposeOcr();

// 인식 설정 초기화
RecognitionSettings settings = new RecognitionSettings();

// 이미지 인식           
RecognitionResult result = api.RecognizeImage(imagePath, settings);

// 제안과 함께 철자가 틀린 단어 목록 가져오기
List<SpellCheckError> errorsList = result.GetSpellCheckErrorList(SpellCheckLanguage.Eng);

foreach (var word in errorsList)
{
    Console.WriteLine($"Misspelled Word - {word.Word}");
    foreach (var suggest in word.SuggestedWords)
    {
        Console.WriteLine($"Suggested word - {suggest.Word}");
    }

    Console.WriteLine();
}
OCR 이미지를 텍스트로 변환하고 C#에서 철자 오류를 가져옵니다.

C#에서 철자 오류 목록 가져오기

C#에서 맞춤법 수정을 사용하여 이미지를 텍스트로 변환

아래 단계에 따라 이미지를 텍스트로 변환하고 맞춤법 오류를 자동 수정할 수 있습니다.

  1. 먼저 AsposeOcr 클래스의 인스턴스를 만듭니다.
  2. 다음으로 RecognitionSettings 클래스의 개체를 초기화합니다.
  3. 그런 다음 RecognizeImage() 메서드를 호출하여 RecognitionResult를 가져옵니다. 이미지 경로와 RecognitionSettings 개체를 인수로 사용합니다.
  4. 그런 다음 GetSpellCheckCorrectedText() 메서드를 호출하여 맞춤법이 수정된 텍스트를 가져옵니다.
  5. 마지막으로 결과를 보여줍니다.

다음 샘플 코드는 C#에서 인식된 텍스트의 맞춤법 오류를 자동 수정하는 방법을 보여줍니다.

// 이 코드 예제는 인식된 텍스트에서 맞춤법 오류를 자동 수정하는 방법을 보여줍니다.
// 인식할 이미지의 경로
string imagePath = @"C:\Files\OCR\sample.png";

// OCR API 생성
AsposeOcr api = new AsposeOcr();

// 인식 설정 초기화
RecognitionSettings settings = new RecognitionSettings();

// 이미지에서 텍스트 인식    
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// 수정된 결과 얻기
string correctedResult = result.GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// 결과 보여줘
Console.WriteLine(correctedResult);
C#에서 맞춤법 수정을 사용하여 이미지를 텍스트로 변환

C#에서 맞춤법 수정을 사용하여 이미지를 텍스트로 변환

C#에서 철자가 수정된 인식된 텍스트 저장

아래 단계에 따라 맞춤법 수정 후 이미지에서 인식된 텍스트를 저장할 수 있습니다.

  1. 먼저 AsposeOcr 클래스의 인스턴스를 만듭니다.
  2. 다음으로 RecognitionSettings 클래스의 개체를 초기화합니다.
  3. 그런 다음 RecognizeImage() 메서드를 호출하여 RecognitionResult를 가져옵니다. 이미지 경로와 RecognitionSettings 개체를 인수로 사용합니다.
  4. 마지막으로 Save(string, SaveFormat, bool, SpellCheckLanguage) 메서드를 호출하여 텍스트를 저장합니다. applySpellingCorrection 부울 값을 true로 취합니다.

다음 샘플 코드는 C#에서 맞춤법 수정을 사용하여 텍스트를 저장하는 방법을 보여줍니다.

// 이 코드 예제는 인식된 텍스트를 맞춤법 수정으로 저장하는 방법을 보여줍니다.
// 인식할 이미지의 경로
string imagePath = @"C:\Files\OCR\sample.png";
string resultPath = @"C:\Files\OCR\MyResult.txt";

// OCR API 생성
AsposeOcr api = new AsposeOcr();

// 인식 설정 초기화
RecognitionSettings settings = new RecognitionSettings();
         
// 이미지에서 텍스트 인식 
RecognitionResult result = api.RecognizeImage(imagePath, new RecognitionSettings());

// 수정된 텍스트 저장
result.Save(resultPath, SaveFormat.Text, true, SpellCheckLanguage.Eng);

C#의 맞춤법 검사 텍스트

아래에 제공된 단계에 따라 사용자 정의 텍스트에 대해 맞춤법 검사를 실행할 수도 있습니다.

  1. 먼저 AsposeOcr 클래스의 인스턴스를 만듭니다.
  2. 다음으로 CorrectSpelling() 메서드를 호출합니다. 텍스트를 수정하고 SpellCheckLanguage를 인수로 사용합니다.
  3. 마지막으로 결과를 보여줍니다.

다음 샘플 코드는 C#에서 사용자 지정 텍스트의 맞춤법을 검사하는 방법을 보여줍니다.

// 이 코드 예제는 사용자 지정 텍스트 문자열에서 맞춤법 검사를 실행하는 방법을 보여줍니다.
// 맞춤법 검사용 텍스트
string textToCorrect = "This is sample text wth errrors";

// OCR API 생성
AsposeOcr api = new AsposeOcr();

// 맞춤법 검사를 실행하여 오류 수정
string correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// 결과 보여줘
Console.WriteLine(correctedText);
This is sample text with errors

무료 평가판 라이선스 받기

평가 제한 없이 Aspose.OCR for .NET을 사용해 볼 수 있는 무료 임시 라이선스 받기입니다.

결론

이 문서에서는 다음 방법을 배웠습니다.

  • OCR을 수행하고 C#에서 이미지의 텍스트를 인식합니다.
  • 올바른 단어 제안과 함께 철자가 틀린 단어 목록을 가져옵니다.
  • 자동 수정 철자 오류;
  • 수정된 텍스트를 프로그래밍 방식으로 저장합니다.

또한 문서를 사용하여 .NET API용 Aspose.OCR에 대해 자세히 알아볼 수 있습니다. 모호한 점이 있는 경우 포럼에서 언제든지 문의하십시오.

또한보십시오