이미지 또는 스캔한 문서에 OCR을 수행하여 Java를 사용하여 프로그래밍 방식으로 이미지에서 텍스트를 인식하고 추출할 수 있습니다. 그런 다음 맞춤법 검사기를 실행하여 인식된 텍스트의 맞춤법 오류를 수정할 수 있습니다. 이 기사에서는 Java에서 맞춤법 교정을 사용하여 이미지를 텍스트로 변환하는 방법을 배웁니다.
이 기사에서는 다음 주제를 다룹니다.
- Java Image to Text Converter(맞춤법 수정 포함)
- OCR 이미지를 텍스트로 변환하고 맞춤법 오류 발생
- 맞춤법 수정으로 이미지를 텍스트로 변환
- 맞춤법이 수정된 텍스트에 이미지 저장
- 맞춤법 검사 맞춤 텍스트
철자 수정 기능이 있는 Java 이미지를 텍스트로 변환하는 변환기
이미지를 철자 수정이 있는 텍스트로 변환하기 위해 Aspose.OCR for Java API를 사용할 것입니다. 스캔한 이미지, 스마트폰 사진, 스크린샷, 이미지 영역 및 스캔한 PDF에 대해 OCR을 수행할 수 있습니다. 인식된 텍스트 결과를 인기 문서 형식으로 저장할 수 있습니다. API를 사용하면 이미지를 텍스트로 변환하고 인식된 텍스트의 철자 오류를 자동으로 수정할 수도 있습니다.
AsposeOCR 클래스는 OCR 작업을 수행하는 기본 API입니다. 이 클래스의 RecognizePage(String fullPath, RecognitionSettings settings) 메서드는 지원되는 형식의 이미지에서 텍스트를 인식합니다. API의 CorrectSpelling(String text, SpellCheckLanguage language) 메소드는 철자가 틀린 단어를 텍스트에서 올바른 단어로 대체합니다. RecognitionResult 클래스는 이미지 인식 결과를 나타냅니다. 이 클래스의 saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) 메서드는 문서를 일반 텍스트, PDF 또는 Microsoft Word 문서로 저장합니다. 맞춤법 검사에 지원되는 모든 언어는 SpellCheckLanguage 열거형에 정의되어 있습니다.
API의 JAR을 다운로드하거나 Maven 기반 Java 애플리케이션에서 다음 pom.xml 구성을 추가하십시오.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.6</version>
</dependency>
OCR 이미지를 텍스트로 변환하고 Java에서 철자 오류를 가져옵니다.
아래 단계에 따라 이미지에 OCR을 수행하고 인식된 텍스트의 철자 오류 목록을 가져올 수 있습니다.
- 먼저 AsposeOCR 클래스의 인스턴스를 만듭니다.
- 다음으로 RecognitionSettings 클래스의 개체를 초기화합니다.
- 그런 다음 RecognizePage() 메서드를 호출하여 RecognitionResult를 가져옵니다. 이미지 경로와 RecognitionSettings 개체를 인수로 사용합니다.
- 그런 다음 getSpellCheckErrorList() 메서드를 호출하여 추천과 함께 철자가 틀린 단어 목록을 가져옵니다.
- 마지막으로 SpellCheckError 목록을 반복하고 결과를 표시합니다.
다음 샘플 코드는 Java에서 인식된 텍스트에서 철자 오류 목록을 가져오는 방법을 보여줍니다.
// 이 코드 예제는 인식된 텍스트에서 철자 오류 목록을 가져오는 방법을 보여줍니다.
String imagePath = "C:\\Files\\sample.jpg";
// OCR API 생성
AsposeOCR api = new AsposeOCR();
// 인식 설정 초기화
RecognitionSettings settings = new RecognitionSettings();
// 이미지 인식
RecognitionResult result = api.RecognizePage(imagePath, settings);
// 제안과 함께 철자가 틀린 단어 목록 가져오기
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);
for (SpellCheckError error : errorsList)
{
// 단어 표시
System.out.println("Misspelled Word - " + error.word);
// 추천 단어 표시
for(SuggestedWord suggest : error.suggestedWords)
{
System.out.println("Suggested word - " + suggest.word);
}
System.out.println();
}
Java에서 맞춤법 수정을 사용하여 이미지를 텍스트로 변환
아래 단계에 따라 이미지를 텍스트로 변환하고 맞춤법 오류를 자동 수정할 수 있습니다.
- 먼저 AsposeOCR 클래스의 인스턴스를 만듭니다.
- 다음으로 RecognitionSettings 클래스의 개체를 초기화합니다.
- 그런 다음 RecognizePage() 메서드를 호출하여 RecognitionResult를 가져옵니다. 이미지 경로와 RecognitionSettings 개체를 인수로 사용합니다.
- 그런 다음 getSpellCheckCorrectedText() 메서드를 호출하여 맞춤법이 수정된 텍스트를 가져옵니다.
- 마지막으로 결과를 보여줍니다.
다음 샘플 코드는 Java에서 인식된 텍스트의 맞춤법 오류를 자동 수정하는 방법을 보여줍니다.
// 이 코드 예제는 인식된 텍스트에서 맞춤법 오류를 자동 수정하는 방법을 보여줍니다.
// 인식할 이미지의 경로
String imagePath = "C:\\Files\\sample.jpg";
// OCR API 생성
AsposeOCR api = new AsposeOCR();
// 인식 설정 초기화
RecognitionSettings settings = new RecognitionSettings();
// 이미지에서 텍스트 인식
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());
// 수정된 결과 얻기
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// 결과 보여줘
System.out.println(correctedResult);
Java에서 철자가 수정된 텍스트에 이미지 저장
아래 단계에 따라 맞춤법 수정 후 이미지에서 인식된 텍스트를 저장할 수 있습니다.
- 먼저 AsposeOCR 클래스의 인스턴스를 만듭니다.
- 다음으로 RecognitionSettings 클래스의 개체를 초기화합니다.
- 그런 다음 RecognizePage() 메서드를 호출하여 RecognitionResult를 가져옵니다. 이미지 경로와 RecognitionSettings 개체를 인수로 사용합니다.
- 마지막으로 saveSpellCheckCorrectedText() 메서드를 호출하여 텍스트를 저장합니다.
다음 샘플 코드는 Java에서 맞춤법 수정을 사용하여 텍스트를 저장하는 방법을 보여줍니다.
// 이 코드 예제는 인식된 텍스트를 맞춤법 수정으로 저장하는 방법을 보여줍니다.
// 인식할 이미지의 경로
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";
// OCR API 생성
AsposeOCR api = new AsposeOCR();
// 인식 설정 초기화
RecognitionSettings settings = new RecognitionSettings();
// 이미지에서 텍스트 인식
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());
// 수정된 텍스트 저장
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);
Java의 맞춤법 검사 텍스트
아래에 제공된 단계에 따라 사용자 정의 텍스트에 대해 맞춤법 검사를 실행할 수도 있습니다.
- 먼저 AsposeOCR 클래스의 인스턴스를 만듭니다.
- 다음으로 CorrectSpelling() 메서드를 호출합니다. 텍스트를 수정하고 SpellCheckLanguage를 인수로 사용합니다.
- 마지막으로 결과를 보여줍니다.
다음 샘플 코드는 Java에서 사용자 정의 텍스트의 맞춤법을 검사하는 방법을 보여줍니다.
// 이 코드 예제는 사용자 지정 텍스트 문자열에서 맞춤법 검사를 실행하는 방법을 보여줍니다.
// 맞춤법 검사용 텍스트
String textToCorrect = "This is sample text wth errrors";
// OCR API 생성
AsposeOCR api = new AsposeOCR();
// 맞춤법 검사를 실행하여 오류 수정
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);
// 결과 보여줘
System.out.println(correctedText);
This is sample text with errors
Get a Free Evaluation License
평가 제한 없이 Java용 Aspose.OCR을 사용해 보려면 무료 임시 라이선스를 얻으십시오.
Conclusion
이 문서에서는 다음 방법을 배웠습니다.
- OCR을 수행하고 이미지의 텍스트를 인식합니다.
- 이미지를 텍스트로 변환
- 올바른 단어 제안과 함께 철자가 틀린 단어 목록을 가져옵니다.
- 자동 수정 철자 오류;
- Java를 사용하여 수정된 텍스트를 저장합니다.
철자 수정을 사용하여 이미지를 텍스트로 변환하는 것 외에도 문서를 사용하여 Java API용 Aspose.OCR에 대해 자세히 알아볼 수 있습니다. 모호한 점이 있는 경우 무료 지원 포럼에서 언제든지 문의해 주십시오.