Imagens e documentos digitalizados podem conter informações textuais que talvez você precise processar posteriormente. Para isso, realizar operações de OCR nessas imagens pode ser útil. Você pode extrair texto dessas imagens e salvá-lo como um arquivo PDF pesquisável. Para isso, este artigo ensinará como converter imagens em arquivos PDF pesquisáveis usando C++.
- API C++ para converter imagens em arquivos PDF pesquisáveis
- Converter imagem em arquivo PDF pesquisável usando C++
- Converter imagem distorcida em arquivo PDF pesquisável usando C++
API C++ para converter imagens em arquivos PDF pesquisáveis
Aspose.OCR for C++ é uma API de reconhecimento óptico de caracteres que pode executar operações de OCR de forma confiável em imagens e documentos digitalizados. A API também permite converter imagens em PDFs pesquisáveis. Você pode instalar a API por meio do NuGet ou baixá-la diretamente da seção Downloads.
PM> Install-Package Aspose.OCR.Cpp
Converter imagem em arquivo PDF pesquisável usando C++
O Aspose.OCR para C++ fornece a capacidade de converter imagens JPEG, BMP e PNG em arquivos PDF pesquisáveis. Para conseguir isso, siga os passos abaixo:
- Prepare o buffer para o resultado.
- Defina o valor do membro de estrutura RecognitionSettings.saveformat como fileformat::pdf.
- Execute a operação de OCR na imagem e salve o arquivo PDF usando o método asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
O código de exemplo a seguir mostra como criar um arquivo PDF pesquisável de uma imagem usando C++:
// Caminho do arquivo de origem
std::string image_path = "SourceDirectory\\sample.png";
// Prepare buffer para resultado (em símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Defina as configurações de reconhecimento
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
// Execute a operação de OCR e salve o arquivo de saída.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
Converter imagem distorcida em arquivo PDF pesquisável usando C++
A API também oferece a capacidade de realizar operações de OCR em imagens distorcidas. A seguir estão as etapas para converter uma imagem distorcida em um arquivo PDF pesquisável:
- Prepare o buffer para o resultado.
- Calcule o ângulo de inclinação da imagem usando o método asposeocrgetskew(const char \ imagepath).
- Defina o valor do membro de estrutura RecognitionSettings.saveformat como fileformat::pdf.
- Especifique o ângulo de inclinação usando o membro de estrutura RecognitionSettings.skew.
- Execute a operação de OCR na imagem e salve o arquivo PDF usando o método asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
A seguir estão as etapas para converter uma imagem distorcida em um arquivo PDF pesquisável usando C++:
// Caminho do arquivo de origem
std::string image_path = "SourceDirectory\\skewSample.png";
// Prepare buffer para resultado (em símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Calcular ângulo de inclinação
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// Defina as configurações de reconhecimento
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;
// Execute a operação de OCR e salve o arquivo de saída.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
Obtenha uma licença gratuita
Para experimentar a API sem limitações de avaliação, você pode solicitar uma licença temporária gratuita.
Conclusão
Neste artigo, você aprendeu como converter imagens em arquivos PDF pesquisáveis usando C++. Com o Aspose.OCR para API C++, você pode converter imagens JPEG, BMP e PNG para o formato PDF. A API fornece muitos recursos adicionais que você pode explorar em detalhes visitando a documentação oficial. Em caso de dúvidas, sinta-se à vontade para entrar em contato conosco em nosso fórum de suporte gratuito.