Текст из изображения в текст в Python | Текст изображения Python в текст

Преобразование текста из изображений в редактируемые форматы является важной задачей для различных приложений. Независимо от того, работаете ли вы со отсканированными документами, визитными карточками или рукописными заметками, извлечение текста из изображений может значительно сэкономить время и повысить производительность. В этом сообщении блога мы узнаем, как конвертировать текст из изображений в текст в Python.

В этой статье рассматриваются следующие темы:

Конвертер текста изображения Python в текст

Мы будем использовать Aspose.OCR for Python для преобразования текста из изображений в текст (TXT).Aspose.OCR for Python — это мощная библиотека оптического распознавания символов (OCR), которая позволяет разработчикам извлекать текст из изображений и отсканированных документов в приложениях Python.

Сначала нам нужно установить библиотеку Aspose.OCR. Вы можете легко загрузить пакет или установить API из PyPI, используя следующую команду pip в консоли:

pip install aspose-ocr-python-net 

Преобразование текста из изображения в текст в Python

Мы можем преобразовать текст из изображения и сохранить его в текстовый файл (TXT).Пожалуйста, следуйте инструкциям ниже, чтобы программно извлечь текст из изображений и сохранить его в виде текстового файла.

  1. Создайте экземпляр объекта класса AsposeOcr.
  2. Создайте экземпляр объекта класса OcrInput, используя InputType.SINGLEIMAGE в качестве аргумента.
  3. Добавьте изображение с помощью метода add().Аналогичным образом добавьте больше изображений.
  4. После этого вызовите метод распознавания() с объектом OcrInput в качестве аргумента.
  5. Наконец, сохраните результат в текстовый файл, используя метод save().

В следующем примере кода показано, как преобразовать текст из изображения в текстовый файл в Python.

# В этом примере кода показано, как извлечь текст из изображения и сохранить его как текстовый файл в Python.
import aspose.ocr as ocr

# Создание экземпляра API Aspose.OCR
api = ocr.AsposeOcr()

# Добавить изображение в пакет распознавания
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")

# Распознайте образ
result = api.recognize(img)

# Распечатать результат распознавания
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Конвертер текста из изображения в текст на Python.

Конвертер текста из изображения в текст на Python.

Текст из изображения в текст — расширенный метод

Аналогичным образом мы можем добавить фильтры, такие как «автоперекос», и установить параметры распознавания, такие как режимы области, язык и т. д., при преобразовании текста из изображений в текстовые файлы. Пожалуйста, следуйте инструкциям ниже, чтобы добавить фильтры и настройки распознавания.

  1. Создайте экземпляр объекта класса AsposeOcr.
  2. Инициализируйте объект класса PreprocessingFilters.
  3. Добавьте фильтры с помощью метода add().
  4. Создайте экземпляр объекта класса OcrInput с помощью InputType.SINGLEIMAGE и отфильтруйте объект в качестве аргументов.
  5. Добавьте изображение с помощью метода add().Аналогичным образом добавьте больше изображений.
  6. Инициализируйте объект класса RecognitionSettings.
  7. Укажите параметры распознавания.
  8. После этого вызовите метод распознавания() с объектом OcrInput в качестве аргумента.
  9. Наконец, сохраните результат в текстовый файл с помощью метода save().

В следующем примере кода показано, как указать фильтры и параметры распознавания для преобразования текста из изображения в текстовый файл в Python.

# В этом примере кода показано, как извлечь текст на английском языке из изображения и сохранить его как текстовый файл в Python.
import aspose.ocr as ocr

# Создание экземпляра API Aspose.OCR
api = ocr.AsposeOcr()

# установить параметры предварительной обработки
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())

# Добавить изображение в пакет распознавания
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")

# Установите параметры распознавания
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG

# Распознавать
result = api.recognize(img, settings)

# Распечатать результат распознавания
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);

Библиотека Python OCR – получите бесплатную лицензию

Посетите нашу страницу «Временная лицензия», чтобы узнать, как легко получить бесплатную лицензию и разблокировать неограниченный доступ к библиотеке Python OCR. Начните конвертировать текст из изображений в текстовые файлы уже сегодня!

Конвертер изображения в текст — бесплатные ресурсы

Изучите ресурсы ниже, чтобы узнать больше о функциях и возможностях библиотеки:

Заключение

В этом сообщении блога мы продемонстрировали, как использовать Aspose.OCR for Python для преобразования текста из изображений в файлы TXT. Следуя шагам, описанным выше, вы можете легко интегрировать функцию OCR в свои приложения Python, что позволит вам извлекать и обрабатывать текст из изображений различных типов. Независимо от того, работаете ли вы над оцифровкой документов, извлечением данных или над любой другой задачей, связанной с распознаванием текста, Aspose.OCR предоставляет надежное и эффективное решение. Приятного кодирования!

В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на нашем форуме бесплатной поддержки.

Смотрите также