使用 C# 執行 OCR

OCR(光學字符識別)是一種眾所周知且廣泛使用的技術,用於識別和讀取圖像和掃描文檔中的文本。在 OCR 操作中,圖像上的字符被掃描、識別並轉換為數字形式。可以驗證並保存轉換後的文本以執行進一步的操作。在本文中,我將向您展示如何使用 C# .NET OCR 庫以編程方式執行 OCR 以將圖像轉換為文本。本文的其餘部分分為以下幾個部分。

C# OCR 庫 - 免費下載

Aspose.OCR for .NET 是一個功能強大且高速的 C# OCR 庫,可讓您輕鬆掃描圖像並將其轉換為文本。它不需要冗長的代碼來啟動 OCR 功能並在您的 .NET 應用程序中運行。下面是C#OCR庫的安裝方法。

通過 NuGet 包管理器安裝 C# .NET OCR 庫

只需在 NuGet 包管理器中搜索 Aspose.OCR 並安裝它。

C# OCR 庫

通過包管理器控制台安裝 C# OCR 庫

以下是通過包管理器控制台安裝 Aspose.OCR 的命令。

PM> Install-Package Aspose.OCR

使用 C# OCR 庫將圖像轉換為文本

讓我們看看如何對可能是掃描文檔頁面的圖像執行 OCR。以下是執行此操作的步驟。

以下代碼示例顯示瞭如何使用 C# 將圖像轉換為文本。

// 有關完整示例和數據文件,請訪問 https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// 文檔目錄的路徑。
string dataDir = RunExamples.GetDataDir_OCR();

// 初始化 AsposeOcr 實例
AsposeOcr api = new AsposeOcr();

// 識別圖像
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// 顯示識別出的文字
Console.WriteLine(result);

C# 對單行文字圖片進行OCR

在前面的示例中,我們對包含多行文本的圖像執行了 OCR。但是,圖像可能只包含一行文本。在這種情況下,您可以告訴 API 只識別該行。以下是在 C# 中執行轉換包含單行文本的圖像的步驟。

以下代碼示例顯示如何使用 C# 執行 OCR 和轉換包含單行文本的圖像。

// 有關完整示例和數據文件,請訪問 https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// 文檔目錄的路徑。
string dataDir = RunExamples.GetDataDir_OCR();

// 初始化 AsposeOcr 實例
AsposeOcr api = new AsposeOcr();

// 識別圖像
string result = api.RecognizeLine(dataDir + "sample_line.png");

// 顯示識別的文字
Console.WriteLine(result);

對非英文字符執行 OCR

Aspose.OCR 不限制英文的OCR 功能,您也可以識別其他語言的字符。無論文本的語言如何,識別過程和代碼都將保持不變。以下是 Aspose 的 C# OCR 庫可以識別的字符集。

非英文字符的 OCR

C# OCR 庫 - 獲取免費許可證

您可以通過申請 [免費臨時許可證][7] 來使用 Aspose.OCR 而不受評估限制。

結論

本文演示瞭如何在 C# 中以編程方式執行 OCR 並將圖像轉換為文本。您可以識別包含單行或多行文本的圖像中的字符。從 文檔 了解有關 C# OCR 庫的更多信息。

也可以看看