图像到 DOCX OCR C++

图像和扫描的文档可能包含您可能需要进一步处理的文本信息。您可能已经使用智能手机捕获了文本文档的图片,并希望将其转换为可编辑文档。为此,对图像执行 OCR 可能会很有帮助。使用 OCR,您可以将图像转换为可搜索和可编辑的 Word 文档。为此,本文将教您如何使用 C++ 将图像转换为 Word 文档。

用于将图像转换为 Word 文档的 C++ API

Aspose.OCR for C++ 是一种光学字符识别 API,可以从图像中提取文本。该 API 还使您能够将图像转换为 Word 文档,例如 DOCDOCXTXT 文件。您可以通过 NuGet 安装 API,也可以直接从 Downloads 部分下载。

PM> Install-Package Aspose.OCR.Cpp

使用 C++ 将图像转换为 Word 文档

通常您可能需要搜索或编辑图像中的文本,但您无法这样做。通过对此类图像执行 OCR 并将其转换为 Word 文档,您可以根据需要搜索和编辑文本。为此,请按照以下步骤操作。

以下示例代码展示了如何使用 C++ 将图像转换为 Word 文档:

// 源文件路径
std::string image_path = "SourceDirectory\\sample.png";

// 为结果准备缓冲区(在符号中,len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// 设置识别设置
RecognitionSettings settings;
settings.save_format = file_format::docx;

// 执行 OCR 操作并保存输出文件。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
源图像和输出 Word 文件的屏幕截图

源图像和输出 Word 文件的屏幕截图

使用 C++ 将倾斜图像转换为 Word 文档

图像和扫描的文档有时会出现歪斜。使用 Aspose.OCR for C++ API,您可以对倾斜的图像执行 OCR。以下是将倾斜的图像转换为 Word 文档的步骤:

以下示例代码显示了如何使用 C++ 将倾斜的图像转换为 Word 文档:

// 源文件路径
std::string image_path = "SourceDirectory\\skewSample.png";

// 为结果准备缓冲区(在符号中,len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// 计算倾斜角
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// 设置识别设置
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;

// 执行 OCR 操作并保存输出文件。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
源图像和输出 Word 文件的屏幕截图

源图像和输出 Word 文件的屏幕截图

获得免费许可证

为了在没有评估限制的情况下试用 API,您可以申请 免费的临时许可证

结论

在本文中,您学习了如何使用 C++ 将图像转换为 Word 文档。此外,您还了解了如何计算和使用图像的倾斜角度对倾斜的图像执行 OCR。 API 提供了许多附加功能,您可以通过访问 官方文档 来详细了解这些功能。如有任何问题,请随时通过我们的 免费支持论坛 与我们联系。

也可以看看