Imagens ou documentos digitalizados podem conter informações textuais. Você pode converter um documento digitalizado ou uma imagem em um documento pesquisável PDF com OCR programaticamente usando C#. Assim, JPG, PNG, TIFF, BMP e outros formatos de imagem podem ser convertidos em arquivos PDF pesquisáveis. Consulte as seções a seguir para obter mais detalhes:
- Conversor de imagem para PDF pesquisável com OCR – Instalação da API C#
- Converter imagem em PDF pesquisável com OCR programaticamente usando C#
- Converter imagem distorcida em PDF pesquisável com OCR programaticamente em C#
Conversor de imagem para PDF pesquisável com OCR – Instalação da API C#
Aspose.OCR for .NET API pode executar operações de OCR com eficiência em imagens ou documentos digitalizados. Você pode configurar a API baixando o arquivo DLL da seção New Releases ou com o seguinte comando de instalação NuGet:
PM> Install-Package Aspose.OCR
Converter imagem em PDF pesquisável com OCR programaticamente usando C#
Você pode converter um JPG, PNG, TIFF e outros formatos de imagem em um PDF pesquisável com OCR seguindo as etapas abaixo:
- Defina o caminho para a imagem de entrada reconhecer.
- Inicialize a instância da classe AsposeOcr.
- Reconheça a imagem de entrada com o método RecognizeImage.
- Salve a saída em um arquivo PDF pesquisável.
O código abaixo mostra como converter JPG, PNG, TIFF e outros formatos de imagem em PDF pesquisável com OCR usando C#:
// Definir caminho para a imagem de entrada reconhecer
string image = "p24.jpg";
// Inicialize a instância da classe AsposeOcr
AsposeOcr api = new AsposeOcr();
// Reconhecer a imagem de entrada com o método RecognizeImage
RecognitionResult result = api.RecognizeImage(image, new RecognitionSettings());
// Salvar saída em arquivo PDF pesquisável
result.Save("test.pdf", SaveFormat.Pdf);
Converter imagem distorcida em PDF pesquisável com OCR programaticamente em C#
Às vezes, as imagens podem ser distorcidas por diferentes motivos. Às vezes, você pode conhecer o ângulo de inclinação das imagens e especificá-lo antes de reconhecer a imagem, no entanto, você pode calcular o ângulo de inclinação com a API quando não souber o ângulo. As etapas a seguir mostram como converter uma imagem distorcida em um arquivo PDF pesquisável:
- Especifique o caminho para a imagem de entrada.
- Inicialize o objeto da classe AsposeOcr.
- Inicialize a instância da classe RecognitionSettings.
- Calcule o ângulo de inclinação da imagem.
- Reconheça a imagem e salve o arquivo PDF pesquisável de saída.
O código a seguir mostra como converter uma imagem distorcida em um arquivo PDF pesquisável programaticamente usando C#:
// Definir caminho para a imagem de entrada reconhecer
string image = "p24.jpg";
// Inicialize o objeto da classe AsposeOcr
AsposeOcr api = new AsposeOcr();
// Inicializar a instância da classe RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();
// Calcular o ângulo de inclinação da imagem
float angle = api.CalculateSkew(image);
settings.SkewAngle = angle;
// Reconhecer a imagem de entrada com o método RecognizeImage
RecognitionResult result = api.RecognizeImage(image, settings);
// Salvar imagem em arquivo PDF pesquisável com OCR
result.Save("Test.pdf", SaveFormat.Pdf);
Abaixo está uma captura de tela da imagem de entrada e do arquivo PDF de saída:
Obtenha Licença de Avaliação Gratuita
Você pode avaliar a API sem limitações solicitando uma Licença Temporária Gratuita.
Conclusão
Neste artigo, você explorou como converter uma imagem em um arquivo PDF pesquisável programaticamente usando C#. Um JPG, PNG, BMP, TIFF, bem como um documento digitalizado, podem ser convertidos em um arquivo PDF. Você pode explorar outros recursos da API visitando a seção Documentação e sinta-se à vontade para entrar em contato conosco no Fórum de suporte gratuito para esclarecer suas dúvidas.