Imagens e documentos digitalizados podem conter informações textuais que talvez você precise processar posteriormente. Você pode ter capturado imagens de documentos de texto usando seu smartphone que deseja converter em documentos editáveis. Para isso, realizar OCR nas imagens pode ser útil. Com o OCR, você pode converter imagens em documentos do Word pesquisáveis e editáveis. Para isso, este artigo ensinará como converter imagens em documentos do Word usando C++.
- API C++ para converter imagens em documentos do Word
- Converter imagem em documento do Word usando C++
- Converter imagem distorcida em documento do Word usando C++
API C++ para converter imagens em documentos do Word
Aspose.OCR for C++ é uma API de reconhecimento óptico de caracteres que pode extrair texto de imagens. A API também permite converter imagens em documentos do Word como arquivos DOC, DOCX e TXT. Você pode instalar a API por meio do NuGet ou baixá-la diretamente da seção Downloads.
PM> Install-Package Aspose.OCR.Cpp
Converter imagem em documento do Word usando C++
Muitas vezes, você pode precisar pesquisar ou editar o texto nas imagens, mas não pode fazê-lo. Ao realizar o OCR nessas imagens e convertê-las em documentos do Word, você pode pesquisar e editar o texto conforme necessário. Para conseguir isso, siga os passos abaixo.
- Prepare o buffer para o resultado.
- Defina o valor do membro de estrutura RecognitionSettings.saveformat como fileformat::docx.
- Execute a operação de OCR na imagem e salve o arquivo do Word usando o método asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
O código de exemplo a seguir mostra como converter uma imagem em um documento do Word usando C++:
// Caminho do arquivo de origem
std::string image_path = "SourceDirectory\\sample.png";
// Prepare buffer para resultado (em símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Defina as configurações de reconhecimento
RecognitionSettings settings;
settings.save_format = file_format::docx;
// Execute a operação de OCR e salve o arquivo de saída.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
Converter imagem distorcida em documento do Word usando C++
As imagens e os documentos digitalizados às vezes podem ficar distorcidos. Com Aspose.OCR para API C++, você pode executar OCR em imagens distorcidas. A seguir estão as etapas para converter uma imagem distorcida em um documento do Word:
- Prepare o buffer para o resultado.
- Calcule o ângulo de inclinação da imagem usando o método asposeocrgetskew(const char \ imagepath).
- Defina o valor do membro de estrutura RecognitionSettings.saveformat como fileformat::docx.
- Especifique o ângulo de inclinação usando o membro de estrutura RecognitionSettings.skew.
- Execute a operação de OCR na imagem e salve o arquivo do Word usando o método asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
O código de exemplo a seguir mostra como converter uma imagem distorcida em um documento do Word usando C++:
// Caminho do arquivo de origem
std::string image_path = "SourceDirectory\\skewSample.png";
// Prepare buffer para resultado (em símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Calcular ângulo de inclinação
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// Defina as configurações de reconhecimento
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;
// Execute a operação de OCR e salve o arquivo de saída.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
Obtenha uma licença gratuita
Para experimentar a API sem limitações de avaliação, você pode solicitar uma licença temporária gratuita.
Conclusão
Neste artigo, você aprendeu como converter imagens em documentos do Word usando C++. Além disso, você viu como calcular e usar o ângulo de inclinação de uma imagem para executar o OCR em imagens distorcidas. A API fornece muitos recursos adicionais que você pode explorar em detalhes visitando a documentação oficial. Em caso de dúvidas, sinta-se à vontade para entrar em contato conosco em nosso fórum de suporte gratuito.