OCR Obraz do tekstu i korekta pisowni w Javie

Możemy wykonać OCR na obrazach lub zeskanowanych dokumentach, aby programowo rozpoznać i wyodrębnić tekst z obrazów przy użyciu języka Java. Następnie możemy uruchomić moduł sprawdzania pisowni, aby poprawić błędy pisowni w rozpoznanym tekście. W tym artykule dowiemy się, jak przekonwertować obraz na tekst z korektą pisowni w Javie.

W tym artykule zostaną omówione następujące tematy:

  1. Konwerter obrazu Java na tekst z korektą pisowni
  2. OCR obrazu do tekstu i uzyskać błędy ortograficzne
  3. Konwertuj obraz na tekst z korektą pisowni
  4. Zapisz obraz w tekście z poprawioną pisownią
  5. Niestandardowy tekst sprawdzania pisowni

Konwerter obrazu Java na tekst z korektą pisowni

Aby przekonwertować obraz na tekst z poprawkami pisowni, użyjemy API Aspose.OCR for Java. Umożliwia wykonywanie OCR na zeskanowanych obrazach, zdjęciach ze smartfona, zrzutach ekranu, obszarach obrazu i zeskanowanych plikach PDF. Umożliwia zapisywanie rozpoznanych wyników tekstowych w popularnych formatach dokumentów. API umożliwia również konwersję obrazów na tekst oraz autokorektę błędów ortograficznych w rozpoznanym tekście.

Klasa AsposeOCR jest podstawowym API do wykonywania operacji OCR. Metoda RecognizePage(String fullPath, RecognitionSettings settings) tej klasy rozpoznaje tekst na obrazach w obsługiwanych formatach. Metoda CorrectSpelling(String text, SpellCheckLanguage language) interfejsu API zastępuje błędne słowa poprawnymi słowami w tekście. Klasa RecognitionResult reprezentuje wyniki rozpoznawania obrazu. Metoda saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) tej klasy zapisuje dokument jako zwykły tekst, PDF lub Dokument Microsoft Word. Wszystkie obsługiwane języki do sprawdzania pisowni są zdefiniowane w wyliczeniu SpellCheckLanguage.

Pobierz plik JAR interfejsu API lub dodaj następującą konfigurację pom.xml w aplikacji Java opartej na Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>22.6</version>
</dependency>

Obraz OCR do tekstu i znajdź błędy ortograficzne w Javie

Możemy wykonać OCR na obrazach i uzyskać listę błędów ortograficznych w rozpoznanym tekście, wykonując czynności podane poniżej:

  1. Najpierw utwórz instancję klasy AsposeOCR.
  2. Następnie zainicjuj obiekt klasy RecognitionSettings.
  3. Następnie pobierz RecognitionResult, wywołując metodę RecognizePage(). Pobiera ścieżkę obrazu i obiekt RecognitionSettings jako argumenty.
  4. Następnie wywołaj metodę getSpellCheckErrorList(), aby uzyskać listę błędnie napisanych słów wraz z sugestiami.
  5. Na koniec przejrzyj listę błędów SpellCheckError i pokaż wyniki.

Poniższy przykładowy kod pokazuje, jak uzyskać listę błędów ortograficznych z rozpoznanego tekstu w Javie.

// Ten przykład kodu pokazuje, jak uzyskać listę błędów pisowni z rozpoznanego tekstu
String imagePath = "C:\\Files\\sample.jpg";

// Utwórz API OCR
AsposeOCR api = new AsposeOCR();

// Zainicjuj ustawienia rozpoznawania
RecognitionSettings settings = new RecognitionSettings();

// Rozpoznaj obraz           
RecognitionResult result = api.RecognizePage(imagePath, settings);

// Uzyskaj listę błędnie napisanych słów z sugestiami
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);

for (SpellCheckError error : errorsList)
{
    // Pokaż słowo
    System.out.println("Misspelled Word - " + error.word);
  
    // Wyświetl sugerowane słowa
    for(SuggestedWord suggest : error.suggestedWords)
    {
      System.out.println("Suggested word - " + suggest.word);
    }

    System.out.println();
}
Obraz OCR do tekstu i znajdź błędy ortograficzne w Javie

Pobierz listę błędów ortograficznych w Javie

Konwertuj obraz na tekst z korektą pisowni w Javie

Możemy przekonwertować obraz na tekst i automatycznie poprawić błędy ortograficzne, wykonując poniższe czynności:

  1. Najpierw utwórz instancję klasy AsposeOCR.
  2. Następnie zainicjuj obiekt klasy RecognitionSettings.
  3. Następnie pobierz RecognitionResult, wywołując metodę RecognizePage(). Pobiera ścieżkę obrazu i obiekt RecognitionSettings jako argumenty.
  4. Następnie wywołaj metodę getSpellCheckCorrectedText(), aby uzyskać tekst z poprawką pisowni.
  5. Na koniec pokaż wyniki.

Poniższy przykładowy kod pokazuje, jak automatycznie poprawiać błędy pisowni z rozpoznanego tekstu w Javie.

// Ten przykład kodu pokazuje, jak automatycznie poprawiać błędy pisowni z rozpoznanego tekstu.
// Ścieżka do obrazu do rozpoznania
String imagePath = "C:\\Files\\sample.jpg";

// Utwórz API OCR
AsposeOCR api = new AsposeOCR();

// Zainicjuj ustawienia rozpoznawania
RecognitionSettings settings = new RecognitionSettings();

// Rozpoznaj tekst z obrazu    
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Uzyskaj poprawiony wynik
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Pokaż wyniki
System.out.println(correctedResult);
Konwertuj obraz na tekst z korektą pisowni w Javie

Konwertuj obraz na tekst z korektą pisowni w Javie

Zapisz obraz do tekstu z poprawioną pisownią w Javie

Możemy zapisać rozpoznany tekst z obrazu po poprawieniu pisowni, wykonując następujące czynności:

  1. Najpierw utwórz instancję klasy AsposeOCR.
  2. Następnie zainicjuj obiekt klasy RecognitionSettings.
  3. Następnie uzyskaj RecognitionResult, wywołując metodę RecognizePage(). Pobiera ścieżkę obrazu i obiekt RecognitionSettings jako argumenty.
  4. Na koniec wywołaj metodę saveSpellCheckCorrectedText(), aby zapisać tekst.

Poniższy przykładowy kod pokazuje, jak zapisać tekst z korektą pisowni w Javie.

// Ten przykład kodu pokazuje, jak zapisać rozpoznany tekst z korektą pisowni.
// Ścieżka do obrazu do rozpoznania
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// Utwórz API OCR
AsposeOCR api = new AsposeOCR();

// Zainicjuj ustawienia rozpoznawania
RecognitionSettings settings = new RecognitionSettings();

// Rozpoznaj tekst z obrazu 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Zapisz poprawiony tekst
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

Sprawdź pisownię tekstu w Javie

Możemy również uruchomić sprawdzanie pisowni w niestandardowym tekście, wykonując czynności podane poniżej:

  1. Najpierw utwórz instancję klasy AsposeOCR.
  2. Następnie wywołaj metodę CorrectSpelling(). Poprawia tekst i SpellCheckLanguage jako argumenty.
  3. Na koniec pokaż wyniki.

Poniższy przykładowy kod pokazuje, jak sprawdzać pisownię niestandardowego tekstu w Javie.

// Ten przykład kodu demonstruje, jak uruchomić sprawdzanie pisowni w niestandardowym ciągu tekstowym.
// Tekst do sprawdzania pisowni
String textToCorrect = "This is sample text wth errrors";

// Utwórz API OCR
AsposeOCR api = new AsposeOCR();

// Uruchom sprawdzanie pisowni, aby poprawić błędy
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Pokaż wyniki
System.out.println(correctedText);
This is sample text with errors

Uzyskaj bezpłatną licencję ewaluacyjną

Możesz uzyskać bezpłatną tymczasową licencję, aby wypróbować Aspose.OCR for Java bez ograniczeń ewaluacyjnych.

Wniosek

W tym artykule dowiedzieliśmy się, jak:

  • wykonywać OCR i rozpoznawać tekst na obrazach;
  • konwertować obrazy na tekst;
  • uzyskać listę błędnie napisanych słów wraz z sugestiami poprawnych słów;
  • autokorekta błędów ortograficznych;
  • zapisz poprawiony tekst za pomocą Javy.

Oprócz konwersji obrazu na tekst z poprawkami pisowni, możesz dowiedzieć się więcej o Aspose.OCR for Java API, korzystając z dokumentacji. W przypadku jakichkolwiek niejasności prosimy o kontakt na naszym bezpłatnym forum pomocy technicznej.

Zobacz też