DjVu 格式用于存储扫描的文档,因为它们可以包括文本、图像或绘图。 DjVu 用于归档数据,因为它能够使用最小的空间存储数据。本文介绍如何在 C# 中以编程方式使用 OCR 操作识别 DjVu 图像中的文本。
DjVu 图像中的文本识别 - C# API 安装
Aspose.OCR for .NET API 支持对不同类型文档(如 JPG、PNG、PDF 等)的光学字符识别。同样,它还支持从多页 DjVu 图像文件中进行文本识别。您可以通过从 下载 部分下载 API 的 JAR 文件来轻松配置 API。同样,您可以运行以下 NuGet 安装命令在项目中安装库:
PM> Install-Package Aspose.OCR
通过在 C# 中对 DjVu 图像执行 OCR 来识别文本
您可以按照以下步骤通过对多页 DjVu 图像执行 OCR 操作来识别文本:
- 使用 AsposeOCR 类初始化 API 实例。
- 创建一个 DocumentRecognitionSettings 类对象。
- 使用 RecognizeDjvu 方法识别文本。
- 打印识别的文本。
以下代码示例展示了如何通过在 C# 中以编程方式执行 OCR 来识别 DjVu 图像中的文本:
// 输入 DJVU 图像文件路径
string imgPath = "sample1.djvu";
// 初始化 AsposeOcr 类对象
AsposeOcr api = new AsposeOcr();
// 识别来自 DJVU 的图像
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.PagesNumber = 0;
List<Aspose.OCR.RecognitionResult> result = api.RecognizeDjvu(imgPath, set);
// 打印结果
int pageNumber = 0;
foreach (var page in result)
{
System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}
获取免费 API 许可证
您可以申请 免费临时许可证 来评估 API,而没有任何评估限制。
结论
总之,您已经学会了如何在多页 DjVu 图像上使用 OCR 操作识别文本。您可以通过指定文档识别设置来识别文本,您可以在其中为输入图像设置自动对比度和倾斜选项,以提高文本识别过程的准确性。此外,您可以通过查看 documentation 部分来探索 API 支持的各种其他功能。如果您需要讨论您的任何疑虑或要求,请随时在 论坛 上给我们写信。