Imagem para PDF OCR

Imagens ou documentos digitalizados podem conter informações textuais. Você pode converter um documento digitalizado ou uma imagem em um documento pesquisável PDF com OCR programaticamente usando C#. Assim, JPG, PNG, TIFF, BMP e outros formatos de imagem podem ser convertidos em arquivos PDF pesquisáveis. Consulte as seções a seguir para obter mais detalhes:

Conversor de imagem para PDF pesquisável com OCR – Instalação da API C#

Aspose.OCR for .NET API pode executar operações de OCR com eficiência em imagens ou documentos digitalizados. Você pode configurar a API baixando o arquivo DLL da seção New Releases ou com o seguinte comando de instalação NuGet:

PM> Install-Package Aspose.OCR

Converter imagem em PDF pesquisável com OCR programaticamente usando C#

Você pode converter um JPG, PNG, TIFF e outros formatos de imagem em um PDF pesquisável com OCR seguindo as etapas abaixo:

  1. Defina o caminho para a imagem de entrada reconhecer.
  2. Inicialize a instância da classe AsposeOcr.
  3. Reconheça a imagem de entrada com o método RecognizeImage.
  4. Salve a saída em um arquivo PDF pesquisável.

O código abaixo mostra como converter JPG, PNG, TIFF e outros formatos de imagem em PDF pesquisável com OCR usando C#:

// Definir caminho para a imagem de entrada reconhecer
string image = "p24.jpg";

// Inicialize a instância da classe AsposeOcr
AsposeOcr api = new AsposeOcr();

// Reconhecer a imagem de entrada com o método RecognizeImage
RecognitionResult result = api.RecognizeImage(image, new RecognitionSettings());

// Salvar saída em arquivo PDF pesquisável
result.Save("test.pdf", SaveFormat.Pdf);

Converter imagem distorcida em PDF pesquisável com OCR programaticamente em C#

Às vezes, as imagens podem ser distorcidas por diferentes motivos. Às vezes, você pode conhecer o ângulo de inclinação das imagens e especificá-lo antes de reconhecer a imagem, no entanto, você pode calcular o ângulo de inclinação com a API quando não souber o ângulo. As etapas a seguir mostram como converter uma imagem distorcida em um arquivo PDF pesquisável:

  1. Especifique o caminho para a imagem de entrada.
  2. Inicialize o objeto da classe AsposeOcr.
  3. Inicialize a instância da classe RecognitionSettings.
  4. Calcule o ângulo de inclinação da imagem.
  5. Reconheça a imagem e salve o arquivo PDF pesquisável de saída.

O código a seguir mostra como converter uma imagem distorcida em um arquivo PDF pesquisável programaticamente usando C#:

// Definir caminho para a imagem de entrada reconhecer
string image = "p24.jpg";

// Inicialize o objeto da classe AsposeOcr
AsposeOcr api = new AsposeOcr();

// Inicializar a instância da classe RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Calcular o ângulo de inclinação da imagem
float angle = api.CalculateSkew(image);
settings.SkewAngle = angle;

// Reconhecer a imagem de entrada com o método RecognizeImage
RecognitionResult result = api.RecognizeImage(image, settings);

// Salvar imagem em arquivo PDF pesquisável com OCR
result.Save("Test.pdf", SaveFormat.Pdf);

Abaixo está uma captura de tela da imagem de entrada e do arquivo PDF de saída:

Imagem para PDF OCR

Obtenha Licença de Avaliação Gratuita

Você pode avaliar a API sem limitações solicitando uma Licença Temporária Gratuita.

Conclusão

Neste artigo, você explorou como converter uma imagem em um arquivo PDF pesquisável programaticamente usando C#. Um JPG, PNG, BMP, TIFF, bem como um documento digitalizado, podem ser convertidos em um arquivo PDF. Você pode explorar outros recursos da API visitando a seção Documentação e sinta-se à vontade para entrar em contato conosco no Fórum de suporte gratuito para esclarecer suas dúvidas.

Veja também