OCR-bild till text- och stavningskorrigering i Java

Vi kan utföra OCR på bilder eller skannade dokument för att känna igen och extrahera text från bilder programmatiskt med hjälp av Java. Vi kan sedan köra en stavningskontroll för att korrigera stavfel i den igenkända texten. I den här artikeln kommer vi att lära oss hur man konverterar en bild till text med stavningskorrigering i Java.

Följande ämnen ska behandlas i den här artikeln:

  1. Java Image to Text Converter med stavningskorrigering
  2. OCR-bild till text och få stavfel
  3. Konvertera bild till text med stavningskorrigering
  4. Spara bild till text med korrigerade stavningar
  5. Stavningskontroll anpassad text

Java Image to Text Converter med stavningskorrigering

För att konvertera en bild till text med stavningskorrigeringar kommer vi att använda Aspose.OCR for Java API. Det gör det möjligt att utföra OCR på skannade bilder, smartphonefoton, skärmdumpar, delar av en bild och skannade PDF-filer. Det gör det möjligt för oss att spara de igenkända textresultaten i populära dokumentformat. API:et tillåter också att konvertera bilder till text och autokorrigera stavfel i den igenkända texten.

Klassen AsposeOCR är det primära API:et för att utföra OCR-operationer. Metoden RecognizePage(String fullPath, RecognitionSettings settings) i den här klassen känner igen text på bilderna i de format som stöds. Metoden CorrectSpelling(String text, SpellCheckLanguage language) i API:t ersätter felstavade ord med korrekta ord i texten. Klassen RecognitionResult representerar resultaten av bildigenkänning. Metoden saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) för denna klass sparar dokumentet som oformaterad text, PDF eller Microsoft Word-dokument. Alla språk som stöds för stavningskontroll är definierade i Stavningskontrollspråk uppräkningen.

Vänligen antingen ladda ner JAR för API:t eller lägg till följande pom.xml-konfiguration i en Maven-baserad Java-applikation.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>22.6</version>
</dependency>

OCR-bild till text och få stavfel i Java

Vi kan utföra OCR på bilder och få en lista över stavfel i den igenkända texten genom att följa stegen nedan:

  1. Skapa först en instans av klassen AsposeOCR.
  2. Initiera sedan ett objekt av klassen RecognitionSettings.
  3. Få sedan RecognitionResult genom att anropa metoden RecognizePage(). Den tar bildsökvägen och RecognitionSettings-objektet som argument.
  4. Därefter anropar du metoden getSpellCheckErrorList() för att få en lista över felstavade ord med förslag.
  5. Slutligen, gå igenom listan SpellCheckError och visa resultaten.

Följande exempelkod visar hur man får en lista över stavfel från en igenkänd text i Java.

// Detta kodexempel visar hur man får en lista över stavfel från en igenkänd text
String imagePath = "C:\\Files\\sample.jpg";

// Skapa OCR API
AsposeOCR api = new AsposeOCR();

// Initiera igenkänningsinställningar
RecognitionSettings settings = new RecognitionSettings();

// Känner igen bilden           
RecognitionResult result = api.RecognizePage(imagePath, settings);

// Få lista över felstavade ord med förslag
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);

for (SpellCheckError error : errorsList)
{
    // Visa ord
    System.out.println("Misspelled Word - " + error.word);
  
    // Visa föreslagna ord
    for(SuggestedWord suggest : error.suggestedWords)
    {
      System.out.println("Suggested word - " + suggest.word);
    }

    System.out.println();
}
OCR-bild till text och få stavfel i Java

Få en lista över stavfel i Java

Konvertera bild till text med stavningskorrigering i Java

Vi kan konvertera en bild till text och autokorrigera stavfel genom att följa stegen nedan:

  1. Skapa först en instans av klassen AsposeOCR.
  2. Initiera sedan ett objekt av klassen RecognitionSettings.
  3. Få sedan RecognitionResult genom att anropa metoden RecognizePage(). Den tar bildsökvägen och RecognitionSettings-objektet som argument.
  4. Därefter anropar du metoden getSpellCheckCorrectedText() för att få text med stavningskorrigering.
  5. Till sist, visa resultaten.

Följande exempelkod visar hur man autokorrigerar stavfel från en igenkänd text i Java.

// Detta kodexempel visar hur man autokorrigerar stavfel från en igenkänd text.
// Sökväg till bilden att känna igen
String imagePath = "C:\\Files\\sample.jpg";

// Skapa OCR API
AsposeOCR api = new AsposeOCR();

// Initiera igenkänningsinställningar
RecognitionSettings settings = new RecognitionSettings();

// Känna igen text från en bild    
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Få korrigerat resultat
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Visa resultat
System.out.println(correctedResult);
Konvertera bild till text med stavningskorrigering i Java

Konvertera bild till text med stavningskorrigering i Java

Spara bild till text med korrigerad stavning i Java

Vi kan spara den igenkända texten från en bild efter stavningskorrigering genom att följa stegen nedan:

  1. Skapa först en instans av klassen AsposeOCR.
  2. Initiera sedan ett objekt av klassen RecognitionSettings.
  3. Efter det får du RecognitionResult genom att anropa metoden RecognizePage(). Det tar bildsökvägen och RecognitionSettings-objektet som argument.
  4. Till sist, anropa metoden saveSpellCheckCorrectedText() för att spara texten.

Följande exempelkod visar hur du sparar texten med stavningskorrigering i Java.

// Detta kodexempel visar hur man sparar den igenkända texten med stavningskorrigering.
// Sökväg till bilden att känna igen
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// Skapa OCR API
AsposeOCR api = new AsposeOCR();

// Initiera igenkänningsinställningar
RecognitionSettings settings = new RecognitionSettings();

// Känna igen text från en bild 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Spara den korrigerade texten
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

Stavningskontrolltext i Java

Vi kan också köra stavningskontroll på en anpassad text genom att följa stegen nedan:

  1. Skapa först en instans av klassen AsposeOCR.
  2. Anropa sedan CorrectSpelling()-metoden. Det tar texten att korrigera och SpellCheckLanguage som argument.
  3. Till sist, visa resultaten.

Följande exempelkod visar hur du stavningskontrollerar anpassad text i Java.

// Det här kodexemplet visar hur man kör stavningskontroll på en anpassad textsträng.
// Text för stavningskontroll
String textToCorrect = "This is sample text wth errrors";

// Skapa OCR API
AsposeOCR api = new AsposeOCR();

// Kör stavningskontroll för att rätta till fel
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Visa resultat
System.out.println(correctedText);
This is sample text with errors

Skaffa en gratis utvärderingslicens

Du kan få en gratis tillfällig licens för att prova Aspose.OCR för Java utan utvärderingsbegränsningar.

Slutsats

I den här artikeln har vi lärt oss hur man:

  • utföra OCR och känna igen text på bilder;
  • konvertera bilder till text;
  • få en lista över de felstavade orden tillsammans med korrekta ordförslag;
  • autokorrigera stavfel;
  • spara den korrigerade texten med Java.

Förutom att konvertera en bild till text med stavningskorrigeringar kan du lära dig mer om Aspose.OCR för Java API med hjälp av dokumentationen. I händelse av oklarheter är du välkommen att kontakta oss på vårt gratis supportforum.

Se även