Преобразование текста из изображений в редактируемые форматы является важной задачей для различных приложений. Независимо от того, работаете ли вы со отсканированными документами, визитными карточками или рукописными заметками, извлечение текста из изображений может значительно сэкономить время и повысить производительность. В этом сообщении блога мы узнаем, как конвертировать текст из изображений в текст в Python.
В этой статье рассматриваются следующие темы:
- Конвертер текста изображения Python в текст
- Преобразование текста из изображения в текст в Python
- Текст из изображения в текст — расширенный метод
- Бесплатные ресурсы
- Получите бесплатную лицензию
Конвертер текста изображения Python в текст
Мы будем использовать Aspose.OCR for Python для преобразования текста из изображений в текст (TXT).Aspose.OCR for Python — это мощная библиотека оптического распознавания символов (OCR), которая позволяет разработчикам извлекать текст из изображений и отсканированных документов в приложениях Python.
Сначала нам нужно установить библиотеку Aspose.OCR. Вы можете легко загрузить пакет или установить API из PyPI, используя следующую команду pip в консоли:
pip install aspose-ocr-python-net
Преобразование текста из изображения в текст в Python
Мы можем преобразовать текст из изображения и сохранить его в текстовый файл (TXT).Пожалуйста, следуйте инструкциям ниже, чтобы программно извлечь текст из изображений и сохранить его в виде текстового файла.
- Создайте экземпляр объекта класса AsposeOcr.
- Создайте экземпляр объекта класса OcrInput, используя InputType.SINGLEIMAGE в качестве аргумента.
- Добавьте изображение с помощью метода add().Аналогичным образом добавьте больше изображений.
- После этого вызовите метод распознавания() с объектом OcrInput в качестве аргумента.
- Наконец, сохраните результат в текстовый файл, используя метод save().
В следующем примере кода показано, как преобразовать текст из изображения в текстовый файл в Python.
# В этом примере кода показано, как извлечь текст из изображения и сохранить его как текстовый файл в Python.
import aspose.ocr as ocr
# Создание экземпляра API Aspose.OCR
api = ocr.AsposeOcr()
# Добавить изображение в пакет распознавания
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")
# Распознайте образ
result = api.recognize(img)
# Распечатать результат распознавания
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Текст из изображения в текст — расширенный метод
Аналогичным образом мы можем добавить фильтры, такие как «автоперекос», и установить параметры распознавания, такие как режимы области, язык и т. д., при преобразовании текста из изображений в текстовые файлы. Пожалуйста, следуйте инструкциям ниже, чтобы добавить фильтры и настройки распознавания.
- Создайте экземпляр объекта класса AsposeOcr.
- Инициализируйте объект класса PreprocessingFilters.
- Добавьте фильтры с помощью метода add().
- Создайте экземпляр объекта класса OcrInput с помощью InputType.SINGLEIMAGE и отфильтруйте объект в качестве аргументов.
- Добавьте изображение с помощью метода add().Аналогичным образом добавьте больше изображений.
- Инициализируйте объект класса RecognitionSettings.
- Укажите параметры распознавания.
- После этого вызовите метод распознавания() с объектом OcrInput в качестве аргумента.
- Наконец, сохраните результат в текстовый файл с помощью метода save().
В следующем примере кода показано, как указать фильтры и параметры распознавания для преобразования текста из изображения в текстовый файл в Python.
# В этом примере кода показано, как извлечь текст на английском языке из изображения и сохранить его как текстовый файл в Python.
import aspose.ocr as ocr
# Создание экземпляра API Aspose.OCR
api = ocr.AsposeOcr()
# установить параметры предварительной обработки
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())
# Добавить изображение в пакет распознавания
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")
# Установите параметры распознавания
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG
# Распознавать
result = api.recognize(img, settings)
# Распечатать результат распознавания
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);
Библиотека Python OCR – получите бесплатную лицензию
Посетите нашу страницу «Временная лицензия», чтобы узнать, как легко получить бесплатную лицензию и разблокировать неограниченный доступ к библиотеке Python OCR. Начните конвертировать текст из изображений в текстовые файлы уже сегодня!
Конвертер изображения в текст — бесплатные ресурсы
Изучите ресурсы ниже, чтобы узнать больше о функциях и возможностях библиотеки:
- Руководство разработчика: Dive into the detailed documentation to learn about advanced features and customization options.
- Бесплатные онлайн-приложения: Experience working applications live!
- Практические руководства и статьи: Follow step-by-step guides to explore specific use cases and examples.
- Справочник по API: Get detailed information on classes, methods, and parameters.
- Примеры кода: Check out code snippets and sample projects to inspire your next project.
Заключение
В этом сообщении блога мы продемонстрировали, как использовать Aspose.OCR for Python для преобразования текста из изображений в файлы TXT. Следуя шагам, описанным выше, вы можете легко интегрировать функцию OCR в свои приложения Python, что позволит вам извлекать и обрабатывать текст из изображений различных типов. Независимо от того, работаете ли вы над оцифровкой документов, извлечением данных или над любой другой задачей, связанной с распознаванием текста, Aspose.OCR предоставляет надежное и эффективное решение. Приятного кодирования!
В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на нашем форуме бесплатной поддержки.