圖像到 DOCX OCR C++

圖像和掃描文檔可能包含您可能需要進一步處理的文本信息。您可能使用智能手機拍攝了文本文檔的圖片,並希望將其轉換為可編輯文檔。為此,對圖像執行 OCR 可以證明是有幫助的。使用 OCR,您可以將圖像轉換為可搜索和可編輯的 Word 文檔。為此,本文將教您如何使用 C++ 將圖像轉換為 Word 文檔。

用於將圖像轉換為 Word 文檔的 C++ API

Aspose.OCR for C++ 是一種光學字符識別 API,可以從圖像中提取文本。該 API 還使您能夠將圖像轉換為 Word 文檔,例如 DOCDOCXTXT 文件。您可以通過 NuGet 安裝 API 或直接從 下載 部分下載。

PM> Install-Package Aspose.OCR.Cpp

使用 C++ 將圖像轉換為 Word 文檔

通常您可能需要搜索或編輯圖像中的文本,但您無法這樣做。通過對此類圖像進行 OCR 並將其轉換為 Word 文檔,您可以根據需要搜索和編輯文本。為此,請按照以下步驟操作。

以下示例代碼顯示瞭如何使用 C++ 將圖像轉換為 Word 文檔:

// 源文件路徑
std::string image_path = "SourceDirectory\\sample.png";

// 為結果準備緩衝區(在符號中,len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// 設置識別設置
RecognitionSettings settings;
settings.save_format = file_format::docx;

// 執行 OCR 操作並保存輸出文件。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
源圖像和輸出 Word 文件的屏幕截圖

源圖像和輸出 Word 文件的屏幕截圖

使用 C++ 將傾斜圖像轉換為 Word 文檔

圖像和掃描文檔有時會傾斜。使用 Aspose.OCR for C++ API,您可以對傾斜圖像執行 OCR。以下是將傾斜圖像轉換為 Word 文檔的步驟:

以下示例代碼顯示瞭如何使用 C++ 將傾斜圖像轉換為 Word 文檔:

// 源文件路徑
std::string image_path = "SourceDirectory\\skewSample.png";

// 為結果準備緩衝區(在符號中,len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// 計算傾斜角度
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// 設置識別設置
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;

// 執行 OCR 操作並保存輸出文件。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
源圖像和輸出 Word 文件的屏幕截圖

源圖像和輸出 Word 文件的屏幕截圖

獲得免費許可證

為了在沒有評估限制的情況下試用 API,您可以申請免費的臨時許可證

結論

在本文中,您學習瞭如何使用 C++ 將圖像轉換為 Word 文檔。此外,您還了解瞭如何計算和使用圖像的傾斜角度對傾斜圖像執行 OCR。 API 提供了許多附加功能,您可以通過訪問 官方文檔 來詳細了解這些功能。如有任何疑問,請隨時通過我們的 免費支持論壇 與我們聯繫。

也可以看看