Converter imagem para Word DOC DOCX com OCR em C++

Imagens e documentos digitalizados podem conter informações textuais que talvez você precise processar posteriormente. Você pode ter capturado imagens de documentos de texto usando seu smartphone que deseja converter em documentos editáveis. Para isso, realizar OCR nas imagens pode ser útil. Com o OCR, você pode converter imagens em documentos do Word pesquisáveis e editáveis. Para isso, este artigo ensinará como converter imagens em documentos do Word usando C++.

API C++ para converter imagens em documentos do Word
Converter imagem em documento do Word usando C++
Converter imagem distorcida em documento do Word usando C++

API C++ para converter imagens em documentos do Word

Aspose.OCR for C++ é uma API de reconhecimento óptico de caracteres que pode extrair texto de imagens. A API também permite converter imagens em documentos do Word como arquivos DOC, DOCX e TXT. Você pode instalar a API por meio do NuGet ou baixá-la diretamente da seção Downloads.

PM> Install-Package Aspose.OCR.Cpp

Converter imagem em documento do Word usando C++

Muitas vezes, você pode precisar pesquisar ou editar o texto nas imagens, mas não pode fazê-lo. Ao realizar o OCR nessas imagens e convertê-las em documentos do Word, você pode pesquisar e editar o texto conforme necessário. Para conseguir isso, siga os passos abaixo.

Prepare o buffer para o resultado.
Defina o valor do membro de estrutura RecognitionSettings.saveformat como fileformat::docx.
Execute a operação de OCR na imagem e salve o arquivo do Word usando o método asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).

O código de exemplo a seguir mostra como converter uma imagem em um documento do Word usando C++:

// Caminho do arquivo de origem
std::string image_path = "SourceDirectory\\sample.png";

// Prepare buffer para resultado (em símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Defina as configurações de reconhecimento
RecognitionSettings settings;
settings.save_format = file_format::docx;

// Execute a operação de OCR e salve o arquivo de saída.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);

Captura de tela da imagem de origem e do arquivo do Word de saída

Converter imagem distorcida em documento do Word usando C++

As imagens e os documentos digitalizados às vezes podem ficar distorcidos. Com Aspose.OCR para API C++, você pode executar OCR em imagens distorcidas. A seguir estão as etapas para converter uma imagem distorcida em um documento do Word:

Prepare o buffer para o resultado.
Calcule o ângulo de inclinação da imagem usando o método asposeocrgetskew(const char \ imagepath).
Defina o valor do membro de estrutura RecognitionSettings.saveformat como fileformat::docx.
Especifique o ângulo de inclinação usando o membro de estrutura RecognitionSettings.skew.
Execute a operação de OCR na imagem e salve o arquivo do Word usando o método asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).

O código de exemplo a seguir mostra como converter uma imagem distorcida em um documento do Word usando C++:

// Caminho do arquivo de origem
std::string image_path = "SourceDirectory\\skewSample.png";

// Prepare buffer para resultado (em símbolos, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Calcular ângulo de inclinação
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Defina as configurações de reconhecimento
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;

// Execute a operação de OCR e salve o arquivo de saída.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);

Obtenha uma licença gratuita

Para experimentar a API sem limitações de avaliação, você pode solicitar uma licença temporária gratuita.

Conclusão

Neste artigo, você aprendeu como converter imagens em documentos do Word usando C++. Além disso, você viu como calcular e usar o ângulo de inclinação de uma imagem para executar o OCR em imagens distorcidas. A API fornece muitos recursos adicionais que você pode explorar em detalhes visitando a documentação oficial. Em caso de dúvidas, sinta-se à vontade para entrar em contato conosco em nosso fórum de suporte gratuito.

Veja também

Converter imagem em texto usando a biblioteca C++ OCR

API C++ para converter imagens em documentos do Word#

Converter imagem em documento do Word usando C++#

Converter imagem distorcida em documento do Word usando C++#

Obtenha uma licença gratuita#

Conclusão#

Veja também#