將圖像轉換為 Word DOCX OCR

您可以使用 C# 以編程方式將包含文本的圖像轉換為可編輯的 word 文檔 (DOCX)。例如,您需要將從掃描儀或照相機捕獲的圖像轉換為可編輯的文檔,然後您需要對輸入圖像執行 OCR。您可以在以下部分了解更多詳細信息:

C# 中的圖像到 Word 文檔 (DOCX) 轉換器 - 安裝

Aspose.OCR for .NET API 可用於識別圖像中的文本。它支持根據您的要求將圖像轉換為文本文件或 word 文檔 (DOCX)。您可以通過從 下載 部分或通過 NuGet 包管理器 使用以下命令下載 DLL 文件來輕鬆配置 API:

PM> Install-Package Aspose.OCR

使用 C# 以編程方式使用 OCR 將圖像轉換為 Word 文檔

有時,您會收到無法搜索或編輯的掃描或捕獲的文本圖像。換句話說,您可以使用 OCR 以編程方式將圖像轉換為可編輯和可搜索的 Word 文檔 (DOCX)。此外,您需要按照以下步驟對圖像進行 OCR 並將結果保存為 DOCX word 文件:

  1. 首先,初始化 AsposeOcr 類的一個實例。
  2. 然後識別輸入圖像。
  3. 最後,將結果保存為 Microsoft Word 文檔格式 (DOCX)。

以下代碼解釋瞭如何使用 C# 以編程方式將圖像轉換為帶有 OCR 的 Word 文檔 (DOCX):

// 初始化 AsposeOcr 實例
AsposeOcr api = new AsposeOcr();

// 識別輸入圖像
RecognitionResult result = api.RecognizeImage("sample.png", new RecognitionSettings { });

// 以 Microsoft Word 文檔格式保存結果
result.Save("sample.docx", SaveFormat.Docx);

在 C# 中使用帶有 OCR 的拼寫檢查將圖像轉換為 Word 文檔

您可以識別不同語言的文本並將圖像轉換為 word 文檔。 API 支持多種語言,並允許您利用詞典來最大限度地提高輸出的效率和真實性。此外,以下是支持對已識別文本進行拼寫檢查的一些常用詞典的列表:

  • 英語:英語詞典
  • Deu:德語詞典
  • 水療中心:西班牙語詞典
  • Fra:法語詞典
  • Swe:瑞典語詞典

此外,您可以參考 API References 找到目前支持的詞典的完整列表。

請按照以下步驟使用 OCR 拼寫檢查將圖像轉換為 Word 文檔 (DOCX):

  1. 首先,實例化 AsposeOcr 類的一個對象。
  2. 使用 RecognizeImage() 方法通過 OCR 識別圖像。
  3. 最後,將結果保存為帶有拼寫檢查的 Word 文檔格式。

下面的代碼詳細說明瞭如何使用 C# 語言以編程方式將圖像中的文本轉換為 word 文檔 (DOCX):

// 初始化 AsposeOcr 實例
AsposeOcr api = new AsposeOcr();

// 使用 OCR 識別圖像
RecognitionResult result = api.RecognizeImage("sample.png", new RecognitionSettings { });

// 使用拼寫檢查將結果保存為 Word 文檔格式
result.Save("Sample_SpellCheck.docx", SaveFormat.Docx, true, SpellChecker.SpellCheckLanguage.Eng);

獲取免費的 API 許可證

有興趣在沒有評估限制的情況下全面測試 API?您可以申請 免費臨時許可證

結論

總之,您已經探索瞭如何使用 C# 以編程方式將文本從圖像轉換為具有 OCR 功能的可編輯或可搜索的 word 文檔。此外,您可以查看 API 文檔 以探索 API 提供的其他功能。此外,如有任何疑問,請隨時通過 免費支持論壇 與我們聯繫。

也可以看看