将图像中的文本转换为可编辑格式是各种应用程序的关键任务。无论您处理的是扫描文档、名片还是手写笔记,从图像中提取文本都可以显著节省时间并提高工作效率。在这篇博文中,我们将学习如何使用 Python 将图像中的文本转换为文本。
本文涵盖以下主题:
Python 图像文本到文本转换器
我们将使用 Aspose.OCR for Python 将文本从图像转换为文本 (TXT)。Aspose.OCR for Python 是一个功能强大的光学字符识别 (OCR) 库,允许开发人员在 Python 应用程序中从图像和扫描文档中提取文本。
首先,我们需要安装 Aspose.OCR 库。您可以轻松下载软件包 或使用控制台中的以下 pip 命令从 PyPI 安装 API:
pip install aspose-ocr-python-net
在 Python 中将文本从图像转换为文本
我们可以从图像中转换文本并将其保存为文本 (TXT) 文件。请按照以下步骤以编程方式从图像中提取文本并将其保存为文本文件。
- 创建AsposeOcr类对象的实例。
- 使用 InputType.SINGLEIMAGE 作为参数实例化 OcrInput 类对象。
- 使用 add() 方法添加图像。同样,添加更多图像。
- 之后,以 OcrInput 对象作为参数调用cognition()方法。
- 最后,使用 save() 方法将结果保存为文本文件。
以下代码示例展示了如何在 Python 中将图像中的文本转换为文本文件。
# 此代码示例展示了如何从图像中提取文本并在 Python 中保存为文本文件
import aspose.ocr as ocr
# 实例化 Aspose.OCR API
api = ocr.AsposeOcr()
# 将图像添加到识别批次
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")
# 识别图像
result = api.recognize(img)
# 打印识别结果
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
文本从图像到文本 - 高级方法
同样,在将文本从图像转换为文本文件时,我们可以添加“自动倾斜”等过滤器,并设置区域模式、语言等识别选项。请按照以下步骤添加过滤器和识别设置。
- 创建AsposeOcr类对象的实例。
- 初始化 PreprocessingFilters 类的对象。
- 使用 add() 方法添加过滤器。
- 使用 InputType.SINGLEIMAGE 和过滤器对象作为参数实例化 OcrInput 类对象。
- 使用 add() 方法添加图像。同样,添加更多图像。
- 初始化 RecognitionSettings 类对象。
- 指定识别选项。
- 之后,使用 OcrInput 对象作为参数调用 understand() 方法。
- 最后,使用 save() 方法将结果保存为文本文件。
以下代码示例展示了如何指定过滤器和识别设置,以便在 Python 中将图像中的文本转换为文本文件。
# 此代码示例展示了如何从图像中提取英语文本并在 Python 中保存为文本文件
import aspose.ocr as ocr
# 实例化 Aspose.OCR API
api = ocr.AsposeOcr()
# 设置预处理选项
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())
# 将图像添加到识别批次
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")
# 设置识别选项
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG
# 认出
result = api.recognize(img, settings)
# 打印识别结果
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);
Python OCR 库 – 获取免费许可证
访问我们的“临时许可证”页面,了解如何轻松获取免费许可证并解锁对 Python OCR 库的无限制访问。立即开始将文本从图像转换为文本文件!
图像文本到文本转换器 – 免费资源
探索以下资源以了解有关图书馆的特性和能力的更多信息:
- 开发人员指南: Dive into the detailed documentation to learn about advanced features and customization options.
- 免费在线申请: Experience working applications live!
- 操作指南和文章: Follow step-by-step guides to explore specific use cases and examples.
- API 参考: Get detailed information on classes, methods, and parameters.
- 代码示例: Check out code snippets and sample projects to inspire your next project.
结论
在这篇博文中,我们演示了如何使用 Aspose.OCR for Python 将文本从图像转换为 TXT 文件。按照上述步骤,您可以轻松地将 OCR 功能集成到 Python 应用程序中,从而能够从各种类型的图像中提取和处理文本。无论您是在进行文档数字化、数据提取还是任何其他与 OCR 相关的任务,Aspose.OCR 都能提供可靠而高效的解决方案。祝您编码愉快!
如果有任何疑问,请随时通过我们的免费支持论坛与我们联系。