Reconhecer texto DjVu Image C# OCR

O formato DjVu é usado para armazenar documentos digitalizados, pois podem incluir texto, imagens ou desenhos. DjVu é usado para arquivar dados porque é capaz de armazenar os dados usando o mínimo de espaço. Este artigo aborda como reconhecer texto de imagens DjVu com operações de OCR programaticamente em C#.

Reconhecimento de texto da imagem DjVu – Instalação da API C#

Aspose.OCR for .NET API suporta reconhecimento óptico de caracteres para diferentes tipos de documentos como JPG, PNG, PDF, etc. Da mesma forma, também suporta reconhecimento de texto de arquivos de imagem DjVu de várias páginas. Você pode configurar facilmente a API baixando o arquivo JAR da API na seção Downloads. Da mesma forma, você pode executar o seguinte comando de instalação NuGet para instalar a biblioteca em seu projeto:

PM> Install-Package Aspose.OCR

Reconhecer texto executando OCR na imagem DjVu em C#

Você pode reconhecer texto executando operações de OCR em imagens DjVu de várias páginas seguindo as etapas abaixo:

  1. Inicialize uma instância de API usando a classe AsposeOCR.
  2. Crie um objeto de classe DocumentRecognitionSettings.
  3. Reconhecer texto usando o método RecognizeDjvu.
  4. Imprima o texto reconhecido.

O exemplo de código a seguir mostra como reconhecer texto de uma imagem DjVu executando o OCR programaticamente em C#:

// Insira o caminho do arquivo de imagem DJVU
string imgPath = "sample1.djvu";

// Inicialize o objeto da classe AsposeOcr
AsposeOcr api = new AsposeOcr();

// Reconhecer imagens do DJVU
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.PagesNumber = 0;
List<Aspose.OCR.RecognitionResult> result = api.RecognizeDjvu(imgPath, set);

// Imprimir resultado
int pageNumber = 0;
foreach (var page in result)
{
    System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}

Obtenha uma licença de API gratuita

Você pode solicitar uma Licença Temporária Gratuita para avaliar a API sem quaisquer limitações de avaliação.

Conclusão

Concluindo, você aprendeu a reconhecer texto com operações de OCR em uma imagem DjVu de várias páginas. Você pode reconhecer texto com a capacidade de especificar as configurações de reconhecimento de documento onde você pode definir opções de contraste automático e inclinação para a imagem de entrada para aumentar a precisão do processo de reconhecimento de texto. Além disso, você pode explorar vários outros recursos suportados pela API consultando a seção documentação. Caso você precise discutir alguma de suas preocupações ou requisitos, sinta-se à vontade para nos escrever no fórum.

Veja também

Converter imagem para Excel com OCR em C#