OCR-Bild zu Text und Rechtschreibkorrektur in Java

Wir können OCR auf Bildern oder gescannten Dokumenten durchführen, um Text aus Bildern programmgesteuert mit Java zu erkennen und zu extrahieren. Wir können dann eine Rechtschreibprüfung ausführen, um Rechtschreibfehler im erkannten Text zu korrigieren. In diesem Artikel erfahren Sie, wie Sie ein Bild mit Rechtschreibkorrektur in Java in Text umwandeln.

Folgende Themen sollen in diesem Artikel behandelt werden:

  1. Java-Bild-zu-Text-Konverter mit Rechtschreibkorrektur
  2. OCR-Bild in Text umwandeln und Rechtschreibfehler erkennen
  3. Bild mit Rechtschreibkorrektur in Text umwandeln
  4. Bild mit korrigierter Schreibweise in Text speichern
  5. Benutzerdefinierter Rechtschreibprüfungstext

Java Image to Text Converter mit Rechtschreibkorrektur

Um ein Bild mit Rechtschreibkorrekturen in Text umzuwandeln, verwenden wir die API Aspose.OCR for Java. Es ermöglicht die Durchführung von OCR an gescannten Bildern, Smartphone-Fotos, Screenshots, Bildbereichen und gescannten PDFs. Es ermöglicht uns, die erkannten Textergebnisse in gängigen Dokumentformaten zu speichern. Die API ermöglicht auch die Konvertierung von Bildern in Text und die automatische Korrektur von Rechtschreibfehlern im erkannten Text.

Die Klasse AsposeOCR ist die primäre API zum Ausführen von OCR-Operationen. Die Methode RecognizePage(String fullPath, RecognitionSettings settings) dieser Klasse erkennt Text auf Bildern in den unterstützten Formaten. Die Methode CorrectSpelling(String text, SpellCheckLanguage language) der API ersetzt falsch geschriebene Wörter durch korrekte Wörter im Text. Die Klasse RecognitionResult repräsentiert die Ergebnisse der Bilderkennung. Die Methode saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) dieser Klasse speichert das Dokument als Nur-Text, PDF oder Microsoft Word-Dokument. Alle unterstützten Sprachen für die Rechtschreibprüfung sind in der Aufzählung SpellCheckLanguage definiert.

Bitte laden Sie entweder die JAR der API herunter oder fügen Sie die folgende pom.xml-Konfiguration in einer Maven-basierten Java-Anwendung hinzu.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>22.6</version>
</dependency>

OCR-Bild in Text umwandeln und Rechtschreibfehler in Java erkennen

Wir können OCR für Bilder durchführen und eine Liste der Rechtschreibfehler im erkannten Text erhalten, indem wir die folgenden Schritte ausführen:

  1. Erstellen Sie zunächst eine Instanz der AsposeOCR-Klasse.
  2. Initialisieren Sie als Nächstes ein Objekt der RecognitionSettings-Klasse.
  3. Rufen Sie dann RecognitionResult ab, indem Sie die Methode RecognizePage() aufrufen. Es verwendet den Bildpfad und das RecognitionSettings-Objekt als Argumente.
  4. Rufen Sie danach die Methode getSpellCheckErrorList() auf, um eine Liste der falsch geschriebenen Wörter mit Vorschlägen zu erhalten.
  5. Durchlaufen Sie schließlich die SpellCheckError-Liste und zeigen Sie die Ergebnisse an.

Der folgende Beispielcode zeigt, wie Sie eine Liste mit Rechtschreibfehlern aus einem erkannten Text in Java erhalten.

// Dieses Codebeispiel zeigt, wie Sie eine Liste mit Rechtschreibfehlern aus einem erkannten Text erhalten
String imagePath = "C:\\Files\\sample.jpg";

// OCR-API erstellen
AsposeOCR api = new AsposeOCR();

// Erkennungseinstellungen initialisieren
RecognitionSettings settings = new RecognitionSettings();

// Bild erkennen           
RecognitionResult result = api.RecognizePage(imagePath, settings);

// Holen Sie sich eine Liste der falsch geschriebenen Wörter mit Vorschlägen
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);

for (SpellCheckError error : errorsList)
{
    // Wort zeigen
    System.out.println("Misspelled Word - " + error.word);
  
    // Vorgeschlagene Wörter anzeigen
    for(SuggestedWord suggest : error.suggestedWords)
    {
      System.out.println("Suggested word - " + suggest.word);
    }

    System.out.println();
}
OCR-Bild in Text umwandeln und Rechtschreibfehler in Java erkennen

Holen Sie sich eine Liste mit Rechtschreibfehlern in Java

Konvertieren Sie Bilder in Text mit Rechtschreibkorrektur in Java

Wir können ein Bild in Text umwandeln und Rechtschreibfehler automatisch korrigieren, indem wir die folgenden Schritte ausführen:

  1. Erstellen Sie zunächst eine Instanz der AsposeOCR-Klasse.
  2. Initialisieren Sie als Nächstes ein Objekt der RecognitionSettings-Klasse.
  3. Rufen Sie dann RecognitionResult ab, indem Sie die Methode RecognizePage() aufrufen. Es verwendet den Bildpfad und das RecognitionSettings-Objekt als Argumente.
  4. Rufen Sie danach die Methode getSpellCheckCorrectedText() auf, um Text mit Rechtschreibkorrektur zu erhalten.
  5. Zeigen Sie abschließend die Ergebnisse.

Der folgende Beispielcode zeigt, wie Rechtschreibfehler in einem erkannten Text in Java automatisch korrigiert werden.

// Dieses Codebeispiel zeigt, wie Rechtschreibfehler in einem erkannten Text automatisch korrigiert werden.
// Pfad zum zu erkennenden Bild
String imagePath = "C:\\Files\\sample.jpg";

// OCR-API erstellen
AsposeOCR api = new AsposeOCR();

// Erkennungseinstellungen initialisieren
RecognitionSettings settings = new RecognitionSettings();

// Text aus einem Bild erkennen    
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Korrigiertes Ergebnis erhalten
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Zeige Ergebnisse
System.out.println(correctedResult);
Konvertieren Sie Bilder in Text mit Rechtschreibkorrektur in Java

Konvertieren Sie Bilder in Text mit Rechtschreibkorrektur in Java

Bild in Text mit korrigierter Rechtschreibung in Java speichern

Wir können den erkannten Text aus einem Bild nach der Rechtschreibkorrektur speichern, indem wir die folgenden Schritte ausführen:

  1. Erstellen Sie zunächst eine Instanz der AsposeOCR-Klasse.
  2. Initialisieren Sie als Nächstes ein Objekt der RecognitionSettings-Klasse.
  3. Rufen Sie danach RecognitionResult ab, indem Sie die Methode RecognizePage() aufrufen. Es verwendet den Bildpfad und das RecognitionSettings-Objekt als Argumente.
  4. Rufen Sie schließlich die Methode saveSpellCheckCorrectedText() auf, um den Text zu speichern.

Der folgende Beispielcode zeigt, wie der Text mit Rechtschreibkorrektur in Java gespeichert wird.

// Dieses Codebeispiel zeigt, wie der erkannte Text mit Rechtschreibkorrektur gespeichert wird.
// Pfad zum zu erkennenden Bild
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// OCR-API erstellen
AsposeOCR api = new AsposeOCR();

// Erkennungseinstellungen initialisieren
RecognitionSettings settings = new RecognitionSettings();

// Text aus einem Bild erkennen 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Speichern Sie den korrigierten Text
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

Rechtschreibprüfung von Text in Java

Wir können auch eine Rechtschreibprüfung für einen benutzerdefinierten Text durchführen, indem Sie die folgenden Schritte ausführen:

  1. Erstellen Sie zunächst eine Instanz der AsposeOCR-Klasse.
  2. Rufen Sie als Nächstes die Methode CorrectSpelling() auf. Es braucht den zu korrigierenden Text und die SpellCheckLanguage als Argumente.
  3. Zeigen Sie abschließend die Ergebnisse.

Der folgende Beispielcode zeigt die Rechtschreibprüfung von benutzerdefiniertem Text in Java.

// Dieses Codebeispiel zeigt, wie die Rechtschreibprüfung für benutzerdefinierte Textzeichenfolgen ausgeführt wird.
// Text zur Rechtschreibprüfung
String textToCorrect = "This is sample text wth errrors";

// OCR-API erstellen
AsposeOCR api = new AsposeOCR();

// Führen Sie die Rechtschreibprüfung aus, um Fehler zu korrigieren
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Zeige Ergebnisse
System.out.println(correctedText);
This is sample text with errors

Get a Free Evaluation License

Sie können eine kostenlose temporäre Lizenz erhalten, um Aspose.OCR für Java ohne Evaluierungseinschränkungen zu testen.

Conclusion

In diesem Artikel haben wir gelernt, wie man:

  • OCR durchführen und Text auf Bildern erkennen;
  • Bilder in Text umwandeln;
  • erhalten Sie eine Liste der falsch geschriebenen Wörter zusammen mit korrekten Wortvorschlägen;
  • Rechtschreibfehler automatisch korrigieren;
  • Speichern Sie den korrigierten Text mit Java.

Neben der Konvertierung eines Bildes in Text mit Rechtschreibkorrekturen können Sie mithilfe der Dokumentation mehr über Aspose.OCR für die Java-API erfahren. Im Falle von Unklarheiten können Sie sich gerne in unserem kostenlosen Support-Forum an uns wenden.

See Also