Imagem para PDF OCR C++

Imagens e documentos digitalizados podem conter informações textuais que talvez você precise processar posteriormente. Para isso, realizar operações de OCR nessas imagens pode ser útil. Você pode extrair texto dessas imagens e salvá-lo como um arquivo PDF pesquisável. Para isso, este artigo ensinará como converter imagens em arquivos PDF pesquisáveis usando C++.

API C++ para converter imagens em arquivos PDF pesquisáveis

Aspose.OCR for C++ é uma API de reconhecimento óptico de caracteres que pode executar operações de OCR de forma confiável em imagens e documentos digitalizados. A API também permite converter imagens em PDFs pesquisáveis. Você pode instalar a API por meio do NuGet ou baixá-la diretamente da seção Downloads.

PM> Install-Package Aspose.OCR.Cpp

Converter imagem em arquivo PDF pesquisável usando C++

O Aspose.OCR para C++ fornece a capacidade de converter imagens JPEG, BMP e PNG em arquivos PDF pesquisáveis. Para conseguir isso, siga os passos abaixo:

O código de exemplo a seguir mostra como criar um arquivo PDF pesquisável de uma imagem usando C++:

// Caminho do arquivo de origem
std::string image_path = "SourceDirectory\\sample.png";

// Prepare buffer para resultado (em símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Defina as configurações de reconhecimento
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;

// Execute a operação de OCR e salve o arquivo de saída.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
Captura de tela da imagem de origem e do arquivo PDF de saída

Captura de tela da imagem de origem e do arquivo PDF de saída

Converter imagem distorcida em arquivo PDF pesquisável usando C++

A API também oferece a capacidade de realizar operações de OCR em imagens distorcidas. A seguir estão as etapas para converter uma imagem distorcida em um arquivo PDF pesquisável:

A seguir estão as etapas para converter uma imagem distorcida em um arquivo PDF pesquisável usando C++:

// Caminho do arquivo de origem
std::string image_path = "SourceDirectory\\skewSample.png";

// Prepare buffer para resultado (em símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Calcular ângulo de inclinação
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Defina as configurações de reconhecimento
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;

// Execute a operação de OCR e salve o arquivo de saída.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
Captura de tela da imagem de origem e do arquivo PDF de saída

Captura de tela da imagem de origem e do arquivo PDF de saída

Obtenha uma licença gratuita

Para experimentar a API sem limitações de avaliação, você pode solicitar uma licença temporária gratuita.

Conclusão

Neste artigo, você aprendeu como converter imagens em arquivos PDF pesquisáveis usando C++. Com o Aspose.OCR para API C++, você pode converter imagens JPEG, BMP e PNG para o formato PDF. A API fornece muitos recursos adicionais que você pode explorar em detalhes visitando a documentação oficial. Em caso de dúvidas, sinta-se à vontade para entrar em contato conosco em nosso fórum de suporte gratuito.

Veja também