Converter imagem para Word DOCX OCR

Você pode converter uma imagem contendo texto em um documento editável do Word (DOCX) programaticamente usando C#. Por exemplo, você precisa converter uma imagem capturada de um scanner ou câmera em um documento editável e, em seguida, executar o OCR na imagem de entrada. Você pode ver mais detalhes nas seguintes seções:

Conversor de imagem para documento do Word (DOCX) em C# - Instalação

A API Aspose.OCR for .NET pode ser usada para reconhecer texto de imagens. Ele suporta a conversão de imagens em arquivos de texto ou documentos do Word (DOCX) conforme suas necessidades. Você pode configurar facilmente a API baixando o arquivo DLL da seção Downloads ou via NuGet Package Manager com o seguinte comando:

PM> Install-Package Aspose.OCR

Converter imagem em documento do Word com OCR programaticamente usando C#

Às vezes, você obtém imagens digitalizadas ou capturadas de texto que não são pesquisáveis ou editáveis. Em outras palavras, você pode converter uma imagem em um documento do Word editável e pesquisável (DOCX) com OCR programaticamente. Além disso, você precisa seguir as etapas abaixo para realizar um OCR na imagem e salvar o resultado como um arquivo de palavra DOCX:

  1. Primeiramente, inicialize uma instância da classe AsposeOcr.
  2. Em seguida, reconheça a imagem de entrada.
  3. Por fim, salve o resultado no formato de documento do Microsoft Word (DOCX).

O código a seguir explica como converter uma imagem em documento do Word (DOCX) com OCR programaticamente usando C#:

// Inicialize uma instância de AsposeOcr
AsposeOcr api = new AsposeOcr();

// Reconhecer imagem de entrada
RecognitionResult result = api.RecognizeImage("sample.png", new RecognitionSettings { });

// Salve o resultado no formato de documento do Microsoft Word
result.Save("sample.docx", SaveFormat.Docx);

Converter imagem em documento do Word usando verificação ortográfica com OCR em C#

Você pode reconhecer texto em diferentes idiomas e converter a imagem em um documento do Word. A API oferece suporte a vários idiomas e permite que você utilize os dicionários para maximizar a eficiência e a autenticidade da saída. Além disso, a seguir está uma lista de alguns dicionários usados popularmente que são suportados para verificação ortográfica em relação ao texto reconhecido:

  • Por: dicionário inglês
  • Deu: dicionário alemão
  • Spa: dicionário espanhol
  • Fra: dicionário francês
  • Swe: dicionário sueco

Além disso, você pode consultar as Referências da API para encontrar a lista completa de dicionários suportados até o momento.

Siga as etapas abaixo para converter a imagem em um documento do Word (DOCX) usando a verificação ortográfica com OCR:

  1. Primeiramente, instancie um objeto da classe AsposeOcr.
  2. Reconheça a imagem com OCR usando o método RecognizeImage().
  3. Por fim, salve o resultado no formato Documento do Word com verificação ortográfica.

O código abaixo explica como converter o texto de uma imagem em um documento do Word (DOCX) programaticamente usando a linguagem C#:

// Inicialize uma instância de AsposeOcr
AsposeOcr api = new AsposeOcr();

// Reconhecer imagem com OCR
RecognitionResult result = api.RecognizeImage("sample.png", new RecognitionSettings { });

// Salve o resultado em seu formato de documento do Word com verificação ortográfica
result.Save("Sample_SpellCheck.docx", SaveFormat.Docx, true, SpellChecker.SpellCheckLanguage.Eng);

Obtenha licença de API gratuita

Interessado em testar a API em sua capacidade total sem limitações de avaliação? Você pode solicitar uma Licença Temporária Gratuita.

Conclusão

Concluindo, você explorou como converter o texto de uma imagem em um documento do Word editável ou pesquisável com o recurso OCR programaticamente usando C#. Além disso, você pode dar uma olhada na Documentação da API para explorar outros recursos oferecidos pela API. Além disso, sinta-se à vontade para entrar em contato conosco no Fórum de suporte gratuito para qualquer dúvida.

Veja também