圖像到 PDF OCR C++

圖像和掃描文檔可能包含您可能需要進一步處理的文本信息。為此,對此類圖像執行 OCR 操作可能會有所幫助。您可以從此類圖像中提取文本並將其保存為可搜索的 PDF 文件。為此,本文將教您如何使用 C++ 將圖像轉換為可搜索的 PDF 文件。

用於將圖像轉換為可搜索 PDF 文件的 C++ API

Aspose.OCR for C++ 是一種光學字符識別 API,可以可靠地對圖像和掃描文檔執行 OCR 操作。 API 還使您能夠將圖像轉換為可搜索的 PDF。您可以通過 NuGet 安裝 API 或直接從 下載 部分下載。

PM> Install-Package Aspose.OCR.Cpp

使用 C++ 將圖像轉換為可搜索的 PDF 文件

Aspose.OCR for C++ 使您能夠將 JPEGBMPPNG 圖像轉換為可搜索的 PDF 文件。為此,請按照以下步驟操作:

以下示例代碼顯示瞭如何使用 C++ 從圖像創建可搜索的 PDF 文件:

// 源文件路徑
std::string image_path = "SourceDirectory\\sample.png";

// 為結果準備緩衝區(在符號中,len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// 設置識別設置
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;

// 執行 OCR 操作並保存輸出文件。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
源圖像和輸出 PDF 文件的屏幕截圖

源圖像和輸出 PDF 文件的屏幕截圖

使用 C++ 將傾斜圖像轉換為可搜索的 PDF 文件

API 還提供了對傾斜圖像執行 OCR 操作的能力。以下是將傾斜圖像轉換為可搜索 PDF 文件的步驟:

以下是使用 C++ 將傾斜圖像轉換為可搜索 PDF 文件的步驟:

// 源文件路徑
std::string image_path = "SourceDirectory\\skewSample.png";

// 為結果準備緩衝區(在符號中,len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// 計算傾斜角度
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// 設置識別設置
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;

// 執行 OCR 操作並保存輸出文件。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
源圖像和輸出 PDF 文件的屏幕截圖

源圖像和輸出 PDF 文件的屏幕截圖

獲得免費許可證

為了在沒有評估限制的情況下試用 API,您可以申請免費的臨時許可證

結論

在本文中,您學習瞭如何使用 C++ 將圖像轉換為可搜索的 PDF 文件。使用 Aspose.OCR for C++ API,您可以將 JPEG、BMP 和 PNG 圖像轉換為 PDF 格式。該 API 提供了許多附加功能,您可以通過訪問 官方文檔 來詳細了解這些功能。如有任何疑問,請隨時通過我們的 免費支持論壇 與我們聯繫。

也可以看看