Текст із зображення в текст у Python | Python Image Text to Text

Перетворення тексту із зображень у формати, які можна редагувати, є важливим завданням для різних програм. Незалежно від того, чи працюєте ви зі сканованими документами, візитними картками чи рукописними нотатками, вилучення тексту із зображень може значно заощадити час і підвищити продуктивність. У цій публікації блогу ми дізнаємося, як конвертувати текст із зображень у текст у Python.

Ця стаття охоплює такі теми:

Перетворювач тексту зображення Python у текст

Ми будемо використовувати Aspose.OCR for Python для перетворення тексту із зображень у текст (TXT).Aspose.OCR for Python — це потужна бібліотека оптичного розпізнавання символів (OCR), яка дозволяє розробникам отримувати текст із зображень і відсканованих документів у програмах Python.

Спочатку нам потрібно встановити бібліотеку Aspose.OCR. Ви можете легко завантажити пакет або встановити API з PyPI за допомогою такої команди pip у консолі:

pip install aspose-ocr-python-net 

Перетворення тексту із зображення на текст у Python

Ми можемо перетворити текст із зображення та зберегти його у текстовий (TXT) файл. Будь ласка, виконайте наведені нижче кроки, щоб програмним шляхом отримати текст із зображень і зберегти його як текстовий файл.

  1. Створіть екземпляр об’єкта класу AsposeOcr.
  2. Створіть екземпляр об’єкта класу OcrInput із InputType.SINGLEIMAGE як аргумент.
  3. Додайте зображення за допомогою методу add().Так само додайте більше зображень.
  4. Після цього викличте метод розпізнавання() з об’єктом OcrInput як аргументом.
  5. Нарешті, збережіть результат як текстовий файл за допомогою методу save().

У наведеному нижче прикладі коду показано, як перетворити текст із зображення на текстовий файл у Python.

# Цей приклад коду показує, як витягти текст із зображення та зберегти як текстовий файл у Python
import aspose.ocr as ocr

# Створення екземпляра Aspose.OCR API
api = ocr.AsposeOcr()

# Додайте зображення до пакету розпізнавання
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")

# Впізнай зображення
result = api.recognize(img)

# Результат розпізнавання друку
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Перетворювач тексту із зображення в текст у Python.

Перетворювач тексту із зображення в текст у Python.

Текст від зображення до тексту - вдосконалений метод

Подібним чином ми можемо додавати такі фільтри, як “autoskew”, і встановлювати параметри розпізнавання, такі як режими області, мова тощо, під час конвертації тексту із зображень у текстові файли. Щоб додати фільтри та налаштування розпізнавання, виконайте наведені нижче дії.

  1. Створіть екземпляр об’єкта класу AsposeOcr.
  2. Ініціалізація об’єкта класу PreprocessingFilters.
  3. Додайте фільтри за допомогою методу add().
  4. Створіть екземпляр об’єкта класу OcrInput за допомогою InputType.SINGLEIMAGE та фільтруйте об’єкт як аргументи.
  5. Додайте зображення за допомогою методу add().Так само додайте більше зображень.
  6. Ініціалізуйте об’єкт класу RecognitionSettings.
  7. Вкажіть параметри розпізнавання.
  8. Після цього викличте метод розпізнавання() з об’єктом OcrInput як аргументом.
  9. Нарешті, збережіть результат як текстовий файл за допомогою методу save().

У наведеному нижче прикладі коду показано, як указати фільтри та параметри розпізнавання для перетворення тексту із зображення у текстовий файл у Python.

# Цей приклад коду показує, як витягти текст англійською мовою із зображення та зберегти як текстовий файл у Python
import aspose.ocr as ocr

# Створення екземпляра Aspose.OCR API
api = ocr.AsposeOcr()

# встановити параметри попередньої обробки
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())

# Додайте зображення до пакету розпізнавання
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")

# Встановіть параметри розпізнавання
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG

# впізнати
result = api.recognize(img, settings)

# Результат розпізнавання друку
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);

Бібліотека OCR Python – отримайте безкоштовну ліцензію

Відвідайте нашу сторінку «Тимчасова ліцензія», щоб дізнатися, як легко отримати безкоштовну ліцензію і розблокувати необмежений доступ до бібліотеки OCR Python. Почніть конвертувати текст із зображень у текстові файли вже сьогодні!

Конвертер тексту зображення в текст – безкоштовні ресурси

Перегляньте наведені нижче ресурси, щоб дізнатися більше про функції та можливості бібліотеки:

Висновок

У цій публікації блогу ми продемонстрували, як використовувати Aspose.OCR for Python для перетворення тексту із зображень у файли TXT. Дотримуючись наведених вище кроків, ви можете легко інтегрувати функцію оптичного розпізнавання символів у свої програми Python, дозволяючи витягувати та обробляти текст із різних типів зображень. Незалежно від того, чи працюєте ви над оцифруванням документів, вилученням даних чи будь-яким іншим завданням, пов’язаним з OCR, Aspose.OCR надасть надійне та ефективне рішення. Щасливого кодування!

У разі будь-яких неясностей зв’яжіться з нами на нашому безкоштовному форумі підтримки.

Дивись також