Python 中的图像文本转 Word | 图像转 DOCX OCR

您是否厌倦了手动从图像中转录文本?如果您有一组扫描的文档、屏幕截图或包含要编辑的文本的图像,那么不要再犹豫了!您可以轻松地对 JPGPNG 图像执行 OCR 并提取文本。在这篇博文中,我们将探讨如何使用 Python 将图像文本转换为 Word 文档,从而更轻松地处理和操作文本数据。本指南将引导您轻松完成从图像中提取文本的过程,并向您展示如何将其保存为 DOCX 格式。

本文涵盖以下主题:

使用 Python OCR 库将图像文本转换为 Word

我们将使用 Aspose.OCR for Python 在 Python 中将图像文本转换为 Word。它是一款功能强大且高效的工具,可从图像中提取文本并将其转换为可编辑的 Word 文档。凭借其先进的 OCR 技术,它可以准确识别和提取各种图像格式中的文本,包括扫描文档、照片和屏幕截图。

请使用控制台中的以下 pip 命令从 下载包PyPI 安装 API:

pip install aspose-ocr-python-net 

使用 Python 将图像文本转换为 Word

我们可以轻松识别和读取图像中的文本并将其转换为 Word 文档。按照以下步骤以编程方式从图像中提取和编辑文本。

  1. 使用 InputType.SINGLEIMAGE 作为参数初始化 OcrInput 类对象。
  2. 使用 add() 方法添加图像。
  3. 创建AsposeOcr类对象的实例。
  4. 之后,以 OcrInput 对象作为参数调用cognition()方法。
  5. 最后,使用 save() 方法将结果保存为 DOCX 文件。

以下代码示例展示了如何在 Python 中将图像文本转换为 Word 文档。

# 此代码示例演示如何在 Python 中将图像文本转换为 Word!
import aspose.ocr as ocr

# 将图像添加到识别批次
inputImg = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
inputImg.add("sample.jpg")

# 实例化 Aspose.OCR API
api = ocr.AsposeOcr()

# 识别图像
result = api.recognize(inputImg)

# 打印识别结果
print(result[0].recognition_text)
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX);
Python 中的图像文本到 Word 转换器。

Python 中的图像文本到 Word 转换器。

图像文本转 Word – 免费资源

想要在 Python 中使用图像文本到 Word 的更多转换功能吗?查看下面的资源以了解有关该库功能的更多信息,看看你还能做什么!

Python OCR 库 – 获取免费许可证

免费开始将图像文本转换为 Word!访问“临时许可证”页面,了解如何轻松获取免费临时许可证,让您可以不受任何限制地试用该库。

结论

在这篇博文中,我们探讨了如何将图像文本转换为可编辑的 Word 文档。通过利用 Aspose.OCR for Python,我们可以高效地从图像中提取文本并将其转换为 Word 格式,从而节省时间并提高工作效率。该库支持 100 多种语言并提供灵活的输出选项,使其成为希望自动化文档处理任务的开发人员和企业的热门选择。通过本指南中概述的步骤,您可以以编程方式从图像中提取文本、自动化文档处理任务、从扫描文档中提取数据等等。所以,继续尝试吧,在您的项目中释放图像到文本转换的潜力!

如果有任何疑问,请随时通过我们的免费支持论坛与我们联系。

也可以看看