Текст изображения в Word в Python | Изображение в формате DOCX OCR

Вы устали вручную расшифровывать текст с изображений? Если у вас есть коллекция отсканированных документов, снимков экрана или изображений, содержащих текст, который вы хотите отредактировать, не ищите дальше! Вы можете легко выполнить распознавание изображений JPG или PNG и извлечь текст. В этом сообщении блога мы рассмотрим, как преобразовать текст изображения в документы Word на Python, чтобы упростить работу с текстовыми данными и манипулирование ими. Это руководство с легкостью проведет вас через процесс извлечения текста из изображений и покажет, как сохранить его в формате DOCX.

В этой статье рассматриваются следующие темы:

Преобразование текста в Word с помощью библиотеки Python OCR

Мы будем использовать Aspose.OCR for Python для преобразования текста изображения в Word на Python. Это мощный и эффективный инструмент для извлечения текста из изображений и преобразования его в редактируемые документы Word. Благодаря передовой технологии оптического распознавания символов он точно распознает и извлекает текст из различных форматов изображений, включая отсканированные документы, фотографии и снимки экрана.

Пожалуйста, загрузите пакет или установите API из PyPI, используя следующую команду pip в консоли:

pip install aspose-ocr-python-net 

Преобразование текста изображения в Word в Python

Мы можем легко распознать и прочитать текст с изображения и преобразовать его в документ Word. Выполните следующие действия, чтобы программно извлекать и редактировать текст из изображений.

  1. Инициализируйте объект класса OcrInput, используя InputType.SINGLEIMAGE в качестве аргумента.
  2. Добавьте изображение с помощью метода add().
  3. Создайте экземпляр объекта класса AsposeOcr.
  4. После этого вызовите метод распознавания() с объектом OcrInput в качестве аргумента.
  5. Наконец, сохраните результат в файл DOCX, используя метод save().

В следующем примере кода показано, как преобразовать текст изображения в документ Word в Python.

# В этом примере кода показано, как преобразовать текст изображения в Word на Python!
import aspose.ocr as ocr

# Добавить изображение в пакет распознавания
inputImg = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
inputImg.add("sample.jpg")

# Создание экземпляра API Aspose.OCR
api = ocr.AsposeOcr()

# Распознайте образ
result = api.recognize(inputImg)

# Распечатать результат распознавания
print(result[0].recognition_text)
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX);
Конвертер текста изображения в слово в Python.

Конвертер текста изображения в слово в Python.

Преобразование текста в Word — бесплатные ресурсы

Хотите больше возможностей по преобразованию текста изображения в Word в Python? Ознакомьтесь с ресурсами ниже, чтобы узнать больше о функциях библиотеки и узнать, что еще вы можете сделать!

Библиотека Python OCR – получите бесплатную лицензию

Начните конвертировать текст изображения в Word бесплатно! Посетите страницу «Временная лицензия», чтобы узнать, как легко получить бесплатную временную лицензию, позволяющую вам опробовать библиотеку без каких-либо ограничений.

Заключение

В этом сообщении блога мы рассмотрели, как преобразовать текст изображения в редактируемые документы Word. Используя Aspose.OCR for Python, мы можем эффективно извлекать текст из изображений и преобразовывать его в формат Word, экономя время и повышая производительность. Библиотека поддерживает более 100 языков и предлагает гибкие параметры вывода, что делает ее популярным выбором для разработчиков и предприятий, стремящихся автоматизировать задачи обработки документов. С помощью шагов, описанных в этом руководстве, вы можете программно извлекать текст из изображений, автоматизировать задачи обработки документов, извлекать данные из отсканированных документов и многое другое. Так что давайте, попробуйте и раскройте потенциал преобразования изображения в текст в своих проектах!

В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на нашем форуме бесплатной поддержки.

Смотрите также