带有 OCR 的 JPG 到 Word 转换器

OCR 是一种可用于从图像中提取文本的技术。这对于各种任务都很有用,例如将扫描的文档转换为可编辑的文本、从图像中提取文本以进行搜索索引等等。在这篇博文中,我们将学习如何使用 C# 开发带有 OCR 的 JPG 到 Word 转换器。我们的转换器将对 JPG 图像执行光学字符识别 (OCR),提取的文本将以 DOCX 格式保存为 Word 文档。

本文将涵盖以下主题:

C# JPG 到 Word 转换器 OCR API – 免费下载

在将 JPG 转换为 Word 时,我们将利用 Aspose.OCR for .NET API。它是一个强大的光学字符识别 (OCR) API,允许开发人员准确地从图像中提取文本。在高质量图像处理方法的支持下,Aspose.OCR for .NET 不仅限于 JPG。它还可以毫无问题地从其他图像类型(如 TIFF、PNG 和 BMP)中识别和提取文本。因此,它是数字化文档、发票处理和简化数据输入的理想自动化工具。

下载 API 的 DLL 或使用 NuGet 安装它。

PM> Install-Package Aspose.OCR

使用 C# 将 JPG 图像转换为 Word

我们可以按照以下步骤以编程方式轻松地将 JPG 图像转换为 Word 文档:

  1. 使用 InputType 作为参数创建 OcrInput 类的实例。
  2. 指定要转换的 JPG 图像。
  3. 初始化一个 AsposeOcr 类对象。
  4. 之后,以 OcrInput 作为参数调用 Recognize() 方法。
  5. 最后,将结果保存为 DOCX 文件。

以下代码示例显示了如何使用 C# 将 JPG 转换为 Word 文档。

// 此代码示例演示如何在 C# 中将 JPG 转换为 Word。
using Aspose.OCR;

// 图片路径
var image = "C:\\Files\\sample.jpg";

// 指定 OCR 输入
var input = new OcrInput(InputType.SingleImage)
{
    image
};

// 初始化 AsposeOcr 实例
AsposeOcr api = new AsposeOcr();

// 识别图像           
var result = api.Recognize(input);

// 将结果保存为 DOCX 文件
foreach(var item in result)
{
    item.Save("C:\\Files\\JPGtoDOCX.docx", SaveFormat.Docx);
}
C# 中的 JPG 到 Word 转换器。

C# 中的 JPG 到 Word 转换器。

OCR JPG 到 Word 转换器 – 获得免费许可证

您可以获得免费的临时许可证 试用 Aspose.OCR 库来评估 JPG 图像到 Word 文档的转换,没有任何限制。

带有 OCR 的 JPG 到 Word 转换器 – 学习资源

您可以使用下面提供的资源了解有关 Aspose.OCR for .NET 的更多信息并探索 API 的各种其他功能:

免费在线将图像转换为文本

您可以使用我们的图像到文本转换器免费在线从 JPG 图像中提取文本,该转换器是使用此 API 开发的。请使用以下链接在浏览器中访问免费在线工具:

https://api.products.aspose.app/ocr/en/scan-image

结论

在这篇博文中,我们学习了如何使用 C# 开发带有 OCR 的 JPG 到 Word 转换器。我们的转换器可用于从 JPG 图像中提取文本并将提取的文本保存到 Word 文档中。如有任何疑问,请随时通过我们的 免费支持论坛 与我们联系。

也可以看看