Imagem OCR para texto e correção ortográfica em Java

Podemos realizar OCR em imagens ou documentos digitalizados para reconhecer e extrair texto de imagens programaticamente usando Java. Podemos então executar um corretor ortográfico para corrigir erros de ortografia no texto reconhecido. Neste artigo, aprenderemos como converter uma imagem em texto com correção ortográfica em Java.

Os seguintes tópicos serão abordados neste artigo:

  1. Java Image to Text Converter com correção ortográfica
  2. Imagem de OCR para texto e erros de ortografia
  3. Converter imagem em texto com correção ortográfica
  4. Salvar imagem em texto com ortografia corrigida
  5. Texto personalizado da verificação ortográfica

Java Image to Text Converter com correção ortográfica

Para converter uma imagem em texto com correções ortográficas, usaremos a API Aspose.OCR for Java. Ele permite realizar OCR em imagens digitalizadas, fotos de smartphones, capturas de tela, áreas de uma imagem e PDFs digitalizados. Ele nos permite salvar os resultados de texto reconhecidos em formatos de documentos populares. A API também permite converter imagens em texto e corrigir automaticamente erros de ortografia no texto reconhecido.

A classe AsposeOCR é a API primária para realizar operações de OCR. O método RecognizePage(String fullPath, RecognitionSettings settings) desta classe reconhece texto nas imagens dos formatos suportados. O método CorrectSpelling(String text, SpellCheckLanguage language) da API substitui palavras com erros ortográficos por palavras corretas no texto. A classe RecognitionResult representa os resultados do reconhecimento de imagem. O método saveSpellCheckCorrectedText(string, Format, SpellCheckLanguage, string) dessa classe salva o documento como texto simples, PDF ou Documento do Microsoft Word. Todos os idiomas com suporte para verificação ortográfica são definidos na enumeração SpellCheckLanguage.

Por favor, faça o download do JAR da API ou adicione a seguinte configuração pom.xml em um aplicativo Java baseado em Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>22.6</version>
</dependency>

Imagem de OCR para texto e erros de ortografia em Java

Podemos realizar o OCR em imagens e obter uma lista de erros de ortografia no texto reconhecido seguindo as etapas abaixo:

  1. Primeiramente, crie uma instância da classe AsposeOCR.
  2. Em seguida, inicialize um objeto da classe RecognitionSettings.
  3. Em seguida, obtenha RecognitionResult chamando o método RecognizePage(). Ele usa o caminho da imagem e o objeto RecognitionSettings como argumentos.
  4. Depois disso, chame o método getSpellCheckErrorList() para obter uma lista de palavras incorretas com sugestões.
  5. Por fim, percorra a lista SpellCheckError e mostre os resultados.

O código de exemplo a seguir mostra como obter uma lista de erros de ortografia de um texto reconhecido em Java.

// Este exemplo de código demonstra como obter uma lista de erros de ortografia de um texto reconhecido
String imagePath = "C:\\Files\\sample.jpg";

// Criar API de OCR
AsposeOCR api = new AsposeOCR();

// Inicialize as configurações de reconhecimento
RecognitionSettings settings = new RecognitionSettings();

// Reconhecer imagem           
RecognitionResult result = api.RecognizePage(imagePath, settings);

// Obter lista de palavras incorretas com sugestões
List<SpellCheckError> errorsList = result.getSpellCheckErrorList(SpellCheckLanguage.Eng);

for (SpellCheckError error : errorsList)
{
    // Mostrar palavra
    System.out.println("Misspelled Word - " + error.word);
  
    // Exibir palavras sugeridas
    for(SuggestedWord suggest : error.suggestedWords)
    {
      System.out.println("Suggested word - " + suggest.word);
    }

    System.out.println();
}
Imagem de OCR para texto e erros de ortografia em Java

Obter uma lista de erros de ortografia em Java

Converter imagem em texto com correção ortográfica em Java

Podemos converter uma imagem em texto e corrigir erros de ortografia seguindo as etapas abaixo:

  1. Primeiramente, crie uma instância da classe AsposeOCR.
  2. Em seguida, inicialize um objeto da classe RecognitionSettings.
  3. Em seguida, obtenha RecognitionResult chamando o método RecognizePage(). Ele usa o caminho da imagem e o objeto RecognitionSettings como argumentos.
  4. Depois disso, chame o método getSpellCheckCorrectedText() para obter o texto com correção ortográfica.
  5. Por fim, mostre os resultados.

O código de exemplo a seguir mostra como corrigir automaticamente erros de ortografia de um texto reconhecido em Java.

// Este exemplo de código demonstra como corrigir automaticamente erros de ortografia de um texto reconhecido.
// Caminho para a imagem a reconhecer
String imagePath = "C:\\Files\\sample.jpg";

// Criar API de OCR
AsposeOCR api = new AsposeOCR();

// Inicialize as configurações de reconhecimento
RecognitionSettings settings = new RecognitionSettings();

// Reconhecer texto de uma imagem    
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Obter resultado corrigido
String correctedResult = result.getSpellCheckCorrectedText(SpellCheckLanguage.Eng);

// Mostrar resultados
System.out.println(correctedResult);
Converter imagem em texto com correção ortográfica em Java

Converter imagem em texto com correção ortográfica em Java

Salvar imagem em texto com ortografia corrigida em Java

Podemos salvar o texto reconhecido de uma imagem após a correção ortográfica seguindo as etapas abaixo:

  1. Primeiramente, crie uma instância da classe AsposeOCR.
  2. Em seguida, inicialize um objeto da classe RecognitionSettings.
  3. Depois disso, obtenha RecognitionResult chamando o método RecognizePage(). Ele usa o caminho da imagem e o objeto RecognitionSettings como argumentos.
  4. Finalmente, chame o método saveSpellCheckCorrectedText() para salvar o texto.

O código de exemplo a seguir mostra como salvar o texto com correção ortográfica em Java.

// Este exemplo de código demonstra como salvar o texto reconhecido com correção ortográfica.
// Caminho para a imagem a reconhecer
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";

// Criar API de OCR
AsposeOCR api = new AsposeOCR();

// Inicialize as configurações de reconhecimento
RecognitionSettings settings = new RecognitionSettings();

// Reconhecer texto de uma imagem 
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());

// Salve o texto corrigido
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);

Texto de verificação ortográfica em Java

Também podemos executar a verificação ortográfica em um texto personalizado seguindo as etapas abaixo:

  1. Primeiramente, crie uma instância da classe AsposeOCR.
  2. Em seguida, chame o método CorrectSpelling(). Leva o texto para corrigir e SpellCheckLanguage como argumentos.
  3. Por fim, mostre os resultados.

O código de exemplo a seguir mostra como verificar a ortografia do texto personalizado em Java.

// Este exemplo de código demonstra como executar a verificação ortográfica em uma string de texto personalizada.
// Texto para verificação ortográfica
String textToCorrect = "This is sample text wth errrors";

// Criar API de OCR
AsposeOCR api = new AsposeOCR();

// Execute a verificação ortográfica para corrigir erros
String correctedText = api.CorrectSpelling(textToCorrect, SpellCheckLanguage.Eng);

// Mostrar resultados
System.out.println(correctedText);
This is sample text with errors

Get a Free Evaluation License

Você pode obter uma licença temporária gratuita para experimentar o Aspose.OCR for Java sem limitações de avaliação.

Conclusion

Neste artigo, aprendemos como:

  • realizar OCR e reconhecer texto em imagens;
  • converter imagens em texto;
  • obter uma lista das palavras incorretas juntamente com sugestões de palavras corretas;
  • erros de ortografia de autocorreção;
  • salve o texto corrigido usando Java.

Além de converter uma imagem em texto com correções ortográficas, você pode aprender mais sobre Aspose.OCR para API Java usando a documentação. Em caso de qualquer ambiguidade, sinta-se à vontade para nos contatar em nosso fórum de suporte gratuito.

See Also