图像到 PDF OCR C++

图像和扫描的文档可能包含您可能需要进一步处理的文本信息。为此,对此类图像执行 OCR 操作可能会有所帮助。您可以从此类图像中提取文本并将其保存为可搜索的 PDF 文件。为此,本文将教您如何使用 C++ 将图像转换为可搜索的 PDF 文件。

用于将图像转换为可搜索 PDF 文件的 C++ API

Aspose.OCR for C++ 是一种光学字符识别 API,可以可靠地对图像和扫描文档执行 OCR 操作。该 API 还使您能够将图像转换为可搜索的 PDF。您可以通过 NuGet 安装 API,也可以直接从 下载 部分下载。

PM> Install-Package Aspose.OCR.Cpp

使用 C++ 将图像转换为可搜索的 PDF 文件

Aspose.OCR for C++ 让您能够将 JPEGBMPPNG 图像转换为可搜索的 PDF 文件。为此,请按照以下步骤操作:

以下示例代码展示了如何使用 C++ 从图像创建可搜索的 PDF 文件:

// 源文件路径
std::string image_path = "SourceDirectory\\sample.png";

// 为结果准备缓冲区(在符号中,len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// 设置识别设置
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;

// 执行 OCR 操作并保存输出文件。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
源图像和输出 PDF 文件的屏幕截图

源图像和输出 PDF 文件的屏幕截图

使用 C++ 将倾斜的图像转换为可搜索的 PDF 文件

该 API 还提供了对倾斜图像执行 OCR 操作的能力。以下是将倾斜的图像转换为可搜索的 PDF 文件的步骤:

以下是使用 C++ 将倾斜图像转换为可搜索 PDF 文件的步骤:

// 源文件路径
std::string image_path = "SourceDirectory\\skewSample.png";

// 为结果准备缓冲区(在符号中,len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// 计算倾斜角
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// 设置识别设置
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;

// 执行 OCR 操作并保存输出文件。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
源图像和输出 PDF 文件的屏幕截图

源图像和输出 PDF 文件的屏幕截图

获得免费许可证

为了在没有评估限制的情况下试用 API,您可以申请 免费的临时许可证

结论

在本文中,您学习了如何使用 C++ 将图像转换为可搜索的 PDF 文件。使用 Aspose.OCR for C++ API,您可以将 JPEG、BMP 和 PNG 图像转换为 PDF 格式。 API 提供了许多附加功能,您可以通过访问 官方文档 来详细了解这些功能。如有任何问题,请随时通过我们的 免费支持论坛 与我们联系。

也可以看看