OCR obrázek na text a oprava pravopisu v Javě

Můžeme provádět OCR na obrázcích nebo naskenovaných dokumentech, abychom rozpoznávali a extrahovali text z obrázků programově pomocí Java. Poté můžeme spustit kontrolu pravopisu a opravit pravopisné chyby v rozpoznaném textu. V tomto článku se naučíme, jak převést obrázek na text s opravou pravopisu v Javě.

V tomto článku se budou zabývat následujícími tématy:

  1. Java Image to Text Converter s opravou pravopisu
  2. OCR obrázek na text a pravopisné chyby
  3. Převést obrázek na text s opravou pravopisu
  4. Uložit obrázek do textu s opraveným pravopisem
  5. Vlastní text kontroly pravopisu

Java Image to Text Converter s opravou pravopisu

K převodu obrázku na text s opravami pravopisu použijeme Aspose.OCR for Java API. Umožňuje provádět OCR na naskenovaných obrázcích, fotografiích smartphonu, snímcích obrazovky, oblastech obrázku a naskenovaných souborech PDF. Umožňuje nám uložit rozpoznané textové výsledky v oblíbených formátech dokumentů. API také umožňuje převod obrázků na text a automatické opravy pravopisných chyb v rozpoznaném textu.

Třída AsposeOCR je primární API pro provádění operací OCR. Metoda RecognizePage(String fullPath, RecognitionSettings settings) této třídy rozpoznává text na obrázcích podporovaných formátů. Metoda CorrectSpelling(String text, SpellCheckLanguage language) rozhraní API nahrazuje chybně napsaná slova správnými slovy v textu. Třída RecognitionResult představuje výsledky rozpoznávání obrázků. Metoda saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) této třídy uloží dokument jako prostý text, PDF nebo dokument Microsoft Word. Všechny podporované jazyky pro kontrolu pravopisu jsou definovány ve výčtu SpellCheckLanguage.

Prosím buď stáhněte si JAR API, nebo přidejte následující konfiguraci pom.xml do Java aplikace založené na Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>22.6</version>
</dependency>

OCR obrázek na text a pravopisné chyby v Javě

Pomocí následujících kroků můžeme provést OCR na obrázcích a získat seznam pravopisných chyb v rozpoznaném textu:

  1. Nejprve vytvořte instanci třídy AsposeOCR.
  2. Dále inicializujte objekt třídy RecognitionSettings.
  3. Poté získejte RecognitionResult voláním metody RecognizePage(). Jako argumenty bere cestu k obrázku a objekt RecognitionSettings.
  4. Poté zavolejte metodu getSpellCheckErrorList() a získejte seznam chybně napsaných slov s návrhy.
  5. Nakonec projděte seznam SpellCheckError a zobrazte výsledky.

Následující ukázkový kód ukazuje, jak získat seznam pravopisných chyb z rozpoznaného textu v Javě.

// Tento příklad kódu ukazuje, jak získat seznam pravopisných chyb z rozpoznaného textu
String imagePath = "C:\\Files\\sample.jpg";

// Vytvořte OCR API
AsposeOCR api = new AsposeOCR();

// Inicializujte nastavení rozpoznávání
RecognitionSettings settings = new RecognitionSettings();

// Rozpoznat obrázek           
RecognitionResult result = api.RecognizePage(imagePath, settings);

// Získejte seznam chybně napsaných slov s návrhy
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);

for (SpellCheckError error : errorsList)
{
    // Zobrazit slovo
    System.out.println("Misspelled Word - " + error.word);
  
    // Zobrazit navrhovaná slova
    for(SuggestedWord suggest : error.suggestedWords)
    {
      System.out.println("Suggested word - " + suggest.word);
    }

    System.out.println();
}
OCR obrázek na text a pravopisné chyby v Javě

Získejte seznam pravopisných chyb v Javě

Převést obrázek na text s opravou pravopisu v Javě

Můžeme převést obrázek na text a automaticky opravit pravopisné chyby podle následujících kroků:

  1. Nejprve vytvořte instanci třídy AsposeOCR.
  2. Dále inicializujte objekt třídy RecognitionSettings.
  3. Poté získejte RecognitionResult voláním metody RecognizePage(). Jako argumenty bere cestu k obrázku a objekt RecognitionSettings.
  4. Poté zavolejte metodu getSpellCheckCorrectedText() a získejte text s opravou pravopisu.
  5. Nakonec ukažte výsledky.

Následující ukázkový kód ukazuje, jak automaticky opravit pravopisné chyby z rozpoznaného textu v jazyce Java.

// Tento příklad kódu ukazuje, jak automaticky opravit pravopisné chyby z rozpoznaného textu.
// Cesta k obrázku k rozpoznání
String imagePath = "C:\\Files\\sample.jpg";

// Vytvořte OCR API
AsposeOCR api = new AsposeOCR();

// Inicializujte nastavení rozpoznávání
RecognitionSettings settings = new RecognitionSettings();

// Rozpoznejte text z obrázku    
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Získejte opravený výsledek
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Ukázat výsledky
System.out.println(correctedResult);
Převést obrázek na text s opravou pravopisu v Javě

Převést obrázek na text s opravou pravopisu v Javě

Uložit obrázek do textu s opraveným pravopisem v Javě

Rozpoznaný text z obrázku po opravě pravopisu můžeme uložit podle následujících kroků:

  1. Nejprve vytvořte instanci třídy AsposeOCR.
  2. Dále inicializujte objekt třídy RecognitionSettings.
  3. Poté získejte RecognitionResult voláním metody RecognizePage(). Jako argumenty bere cestu k obrázku a objekt RecognitionSettings.
  4. Nakonec zavolejte metodu saveSpellCheckCorrectedText() a text uložte.

Následující ukázkový kód ukazuje, jak uložit text s opravou pravopisu v Javě.

// Tento příklad kódu ukazuje, jak uložit rozpoznaný text s opravou pravopisu.
// Cesta k obrázku k rozpoznání
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// Vytvořte OCR API
AsposeOCR api = new AsposeOCR();

// Inicializujte nastavení rozpoznávání
RecognitionSettings settings = new RecognitionSettings();

// Rozpoznejte text z obrázku 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Uložte opravený text
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

Kontrola pravopisu textu v Javě

Můžeme také spustit kontrolu pravopisu u vlastního textu podle následujících kroků:

  1. Nejprve vytvořte instanci třídy AsposeOCR.
  2. Dále zavolejte metodu CorrectSpelling(). Vyžaduje opravu textu a SpellCheckLanguage jako argumenty.
  3. Nakonec ukažte výsledky.

Následující ukázkový kód ukazuje, jak kontrolovat pravopis vlastního textu v Javě.

// Tento příklad kódu ukazuje, jak spustit kontrolu pravopisu na vlastním textovém řetězci.
// Text pro kontrolu pravopisu
String textToCorrect = "This is sample text wth errrors";

// Vytvořte OCR API
AsposeOCR api = new AsposeOCR();

// Spusťte kontrolu pravopisu a opravte chyby
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Ukázat výsledky
System.out.println(correctedText);
This is sample text with errors

Získejte bezplatnou zkušební licenci

Můžete získat bezplatnou dočasnou licenci a vyzkoušet Aspose.OCR pro Javu bez omezení hodnocení.

Závěr

V tomto článku jsme se naučili, jak:

  • provádět OCR a rozpoznávat text na obrázcích;
  • převést obrázky na text;
  • získat seznam chybně napsaných slov spolu s návrhy správných slov;
  • automatické opravy pravopisných chyb;
  • uložit opravený text pomocí Java.

Kromě převodu obrázku na text s opravami pravopisu se můžete dozvědět více o Aspose.OCR pro Java API pomocí dokumentace. V případě jakýchkoliv nejasností nás neváhejte kontaktovat na našem bezplatném fóru podpory.

Viz také