OCR 是一种可用于从图像中提取文本的技术。这对于各种任务都很有用,例如将扫描的文档转换为可编辑的文本、从图像中提取文本以进行搜索索引等等。在这篇博文中,我们将学习如何使用 C# 开发带有 OCR 的 JPG 到 Word 转换器。我们的转换器将对 JPG 图像执行光学字符识别 (OCR),提取的文本将以 DOCX 格式保存为 Word 文档。
本文将涵盖以下主题:
C# JPG 到 Word 转换器 OCR API – 免费下载
在将 JPG 转换为 Word 时,我们将利用 Aspose.OCR for .NET API。它是一个强大的光学字符识别 (OCR) API,允许开发人员准确地从图像中提取文本。在高质量图像处理方法的支持下,Aspose.OCR for .NET 不仅限于 JPG。它还可以毫无问题地从其他图像类型(如 TIFF、PNG 和 BMP)中识别和提取文本。因此,它是数字化文档、发票处理和简化数据输入的理想自动化工具。
请 下载 API 的 DLL 或使用 NuGet 安装它。
PM> Install-Package Aspose.OCR
使用 C# 将 JPG 图像转换为 Word
我们可以按照以下步骤以编程方式轻松地将 JPG 图像转换为 Word 文档:
- 使用 InputType 作为参数创建 OcrInput 类的实例。
- 指定要转换的 JPG 图像。
- 初始化一个 AsposeOcr 类对象。
- 之后,以 OcrInput 作为参数调用 Recognize() 方法。
- 最后,将结果保存为 DOCX 文件。
以下代码示例显示了如何使用 C# 将 JPG 转换为 Word 文档。
// 此代码示例演示如何在 C# 中将 JPG 转换为 Word。
using Aspose.OCR;
// 图片路径
var image = "C:\\Files\\sample.jpg";
// 指定 OCR 输入
var input = new OcrInput(InputType.SingleImage)
{
image
};
// 初始化 AsposeOcr 实例
AsposeOcr api = new AsposeOcr();
// 识别图像
var result = api.Recognize(input);
// 将结果保存为 DOCX 文件
foreach(var item in result)
{
item.Save("C:\\Files\\JPGtoDOCX.docx", SaveFormat.Docx);
}
OCR JPG 到 Word 转换器 – 获得免费许可证
您可以获得免费的临时许可证 试用 Aspose.OCR 库来评估 JPG 图像到 Word 文档的转换,没有任何限制。
带有 OCR 的 JPG 到 Word 转换器 – 学习资源
您可以使用下面提供的资源了解有关 Aspose.OCR for .NET 的更多信息并探索 API 的各种其他功能:
免费在线将图像转换为文本
您可以使用我们的图像到文本转换器免费在线从 JPG 图像中提取文本,该转换器是使用此 API 开发的。请使用以下链接在浏览器中访问免费在线工具:
https://api.products.aspose.app/ocr/en/scan-image
结论
在这篇博文中,我们学习了如何使用 C# 开发带有 OCR 的 JPG 到 Word 转换器。我们的转换器可用于从 JPG 图像中提取文本并将提取的文本保存到 Word 文档中。如有任何疑问,请随时通过我们的 免费支持论坛 与我们联系。