图像和扫描的文档可能包含您可能需要进一步处理的文本信息。为此,对此类图像执行 OCR 操作可能会有所帮助。您可以从此类图像中提取文本并将其保存为可搜索的 PDF 文件。为此,本文将教您如何使用 C++ 将图像转换为可搜索的 PDF 文件。
用于将图像转换为可搜索 PDF 文件的 C++ API
Aspose.OCR for C++ 是一种光学字符识别 API,可以可靠地对图像和扫描文档执行 OCR 操作。该 API 还使您能够将图像转换为可搜索的 PDF。您可以通过 NuGet 安装 API,也可以直接从 下载 部分下载。
PM> Install-Package Aspose.OCR.Cpp
使用 C++ 将图像转换为可搜索的 PDF 文件
Aspose.OCR for C++ 让您能够将 JPEG、BMP 和 PNG 图像转换为可搜索的 PDF 文件。为此,请按照以下步骤操作:
- 为结果准备缓冲区。
- 将 RecognitionSettings.saveformat 结构成员的值设置为 fileformat::pdf。
- 对图像进行OCR操作,使用asposeocrpagesave(const char\imagepath, const char\savepath, RecognitionSettings settings)方法保存PDF文件。
以下示例代码展示了如何使用 C++ 从图像创建可搜索的 PDF 文件:
// 源文件路径
std::string image_path = "SourceDirectory\\sample.png";
// 为结果准备缓冲区(在符号中,len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// 设置识别设置
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
// 执行 OCR 操作并保存输出文件。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
使用 C++ 将倾斜的图像转换为可搜索的 PDF 文件
该 API 还提供了对倾斜图像执行 OCR 操作的能力。以下是将倾斜的图像转换为可搜索的 PDF 文件的步骤:
- 为结果准备缓冲区。
- 使用 asposeocrgetskew(const char \ imagepath) 方法计算图像的倾斜角度。
- 将 RecognitionSettings.saveformat 结构成员的值设置为 fileformat::pdf。
- 使用 RecognitionSettings.skew 结构成员指定倾斜角度。
- 对图像进行OCR操作,使用asposeocrpagesave(const char\imagepath, const char\savepath, RecognitionSettings settings)方法保存PDF文件。
以下是使用 C++ 将倾斜图像转换为可搜索 PDF 文件的步骤:
// 源文件路径
std::string image_path = "SourceDirectory\\skewSample.png";
// 为结果准备缓冲区(在符号中,len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// 计算倾斜角
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// 设置识别设置
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;
// 执行 OCR 操作并保存输出文件。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
获得免费许可证
为了在没有评估限制的情况下试用 API,您可以申请 免费的临时许可证。
结论
在本文中,您学习了如何使用 C++ 将图像转换为可搜索的 PDF 文件。使用 Aspose.OCR for C++ API,您可以将 JPEG、BMP 和 PNG 图像转换为 PDF 格式。 API 提供了许多附加功能,您可以通过访问 官方文档 来详细了解这些功能。如有任何问题,请随时通过我们的 免费支持论坛 与我们联系。