使用 C# 执行 OCR

OCR(光学字符识别)是一种众所周知且广泛使用的技术,用于识别和读取图像和扫描文档中的文本。在 OCR 操作中,图像上的字符被扫描、识别并转换为数字形式。可以验证并保存转换后的文本以执行进一步的操作。在本文中,我将向您展示如何使用 C# .NET OCR 库以编程方式执行 OCR 以将图像转换为文本。本文的其余部分分为以下几节。

C# OCR 库 - 免费下载

Aspose.OCR for .NET 是用于 C# 的强大且高速的 OCR 库,可让您轻松扫描图像并将其转换为文本。在您的 .NET 应用程序中启动和运行 OCR 功能不需要冗长的代码。以下是 C# OCR 库的安装方法。

通过 NuGet 包管理器安装 C# .NET OCR 库

只需在 NuGet 包管理器中搜索 Aspose.OCR 并安装它。

C# OCR 库

通过包管理器控制台安装 C# OCR 库

以下是通过 Package Manager Console 安装 Aspose.OCR 的命令。

PM> Install-Package Aspose.OCR

使用 C# OCR 库将图像转换为文本

让我们看看如何对可能是扫描文档页面的图像执行 OCR。以下是执行此操作的步骤。

以下代码示例展示了如何使用 C# 将图像转换为文本。

// 如需完整的示例和数据文件,请访问 https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// 文档目录的路径。
string dataDir = RunExamples.GetDataDir_OCR();

// 初始化 AsposeOcr 的一个实例
AsposeOcr api = new AsposeOcr();

// 识别图像
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");

// 显示识别的文本
Console.WriteLine(result);

C# 对带有单行文本的图像执行 OCR

在前面的示例中,我们对包含多行文本的图像执行了 OCR。但是,图像可能仅包含单行文本。在这种情况下,您可以告诉 API 仅识别该行。以下是在 C# 中执行转换包含单行文本的图像的步骤。

以下代码示例展示了如何使用 C# 执行 OCR 和转换包含单行文本的图像。

// 如需完整的示例和数据文件,请访问 https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// 文档目录的路径。
string dataDir = RunExamples.GetDataDir_OCR();

// 初始化 AsposeOcr 的一个实例
AsposeOcr api = new AsposeOcr();

// 识别图像
string result = api.RecognizeLine(dataDir + "sample_line.png");

// 显示识别的文本
Console.WriteLine(result);

对非英文字符执行 OCR

Aspose.OCR 不限制英语的 OCR 功能,您也可以识别其他语言的字符。无论文本的语言如何,识别过程和代码都将保持不变。以下是 Aspose 的 C# OCR 库可以识别的字符集。

非英文字符的 OCR

C# OCR 库 - 获取免费许可证

您可以通过申请 [免费临时许可证][7] 来使用 Aspose.OCR,而不受评估限制。

结论

本文演示了如何在 C# 中以编程方式执行 OCR 并将图像转换为文本。您可以识别包含单行或多行文本的图像中的字符。从 文档 中了解有关 C# OCR 库的更多信息。

也可以看看