Перетворення тексту із зображень у формати, які можна редагувати, є важливим завданням для різних програм. Незалежно від того, чи працюєте ви зі сканованими документами, візитними картками чи рукописними нотатками, вилучення тексту із зображень може значно заощадити час і підвищити продуктивність. У цій публікації блогу ми дізнаємося, як конвертувати текст із зображень у текст у Python.
Ця стаття охоплює такі теми:
- Перетворювач тексту зображення Python у текст
- Перетворення тексту із зображення на текст у Python
- Текст від зображення до тексту - вдосконалений метод
- Безкоштовні ресурси
- Отримайте безкоштовну ліцензію
Перетворювач тексту зображення Python у текст
Ми будемо використовувати Aspose.OCR for Python для перетворення тексту із зображень у текст (TXT).Aspose.OCR for Python — це потужна бібліотека оптичного розпізнавання символів (OCR), яка дозволяє розробникам отримувати текст із зображень і відсканованих документів у програмах Python.
Спочатку нам потрібно встановити бібліотеку Aspose.OCR. Ви можете легко завантажити пакет або встановити API з PyPI за допомогою такої команди pip у консолі:
pip install aspose-ocr-python-net
Перетворення тексту із зображення на текст у Python
Ми можемо перетворити текст із зображення та зберегти його у текстовий (TXT) файл. Будь ласка, виконайте наведені нижче кроки, щоб програмним шляхом отримати текст із зображень і зберегти його як текстовий файл.
- Створіть екземпляр об’єкта класу AsposeOcr.
- Створіть екземпляр об’єкта класу OcrInput із InputType.SINGLEIMAGE як аргумент.
- Додайте зображення за допомогою методу add().Так само додайте більше зображень.
- Після цього викличте метод розпізнавання() з об’єктом OcrInput як аргументом.
- Нарешті, збережіть результат як текстовий файл за допомогою методу save().
У наведеному нижче прикладі коду показано, як перетворити текст із зображення на текстовий файл у Python.
# Цей приклад коду показує, як витягти текст із зображення та зберегти як текстовий файл у Python
import aspose.ocr as ocr
# Створення екземпляра Aspose.OCR API
api = ocr.AsposeOcr()
# Додайте зображення до пакету розпізнавання
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")
# Впізнай зображення
result = api.recognize(img)
# Результат розпізнавання друку
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Текст від зображення до тексту - вдосконалений метод
Подібним чином ми можемо додавати такі фільтри, як “autoskew”, і встановлювати параметри розпізнавання, такі як режими області, мова тощо, під час конвертації тексту із зображень у текстові файли. Щоб додати фільтри та налаштування розпізнавання, виконайте наведені нижче дії.
- Створіть екземпляр об’єкта класу AsposeOcr.
- Ініціалізація об’єкта класу PreprocessingFilters.
- Додайте фільтри за допомогою методу add().
- Створіть екземпляр об’єкта класу OcrInput за допомогою InputType.SINGLEIMAGE та фільтруйте об’єкт як аргументи.
- Додайте зображення за допомогою методу add().Так само додайте більше зображень.
- Ініціалізуйте об’єкт класу RecognitionSettings.
- Вкажіть параметри розпізнавання.
- Після цього викличте метод розпізнавання() з об’єктом OcrInput як аргументом.
- Нарешті, збережіть результат як текстовий файл за допомогою методу save().
У наведеному нижче прикладі коду показано, як указати фільтри та параметри розпізнавання для перетворення тексту із зображення у текстовий файл у Python.
# Цей приклад коду показує, як витягти текст англійською мовою із зображення та зберегти як текстовий файл у Python
import aspose.ocr as ocr
# Створення екземпляра Aspose.OCR API
api = ocr.AsposeOcr()
# встановити параметри попередньої обробки
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())
# Додайте зображення до пакету розпізнавання
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")
# Встановіть параметри розпізнавання
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG
# впізнати
result = api.recognize(img, settings)
# Результат розпізнавання друку
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);
Бібліотека OCR Python – отримайте безкоштовну ліцензію
Відвідайте нашу сторінку «Тимчасова ліцензія», щоб дізнатися, як легко отримати безкоштовну ліцензію і розблокувати необмежений доступ до бібліотеки OCR Python. Почніть конвертувати текст із зображень у текстові файли вже сьогодні!
Конвертер тексту зображення в текст – безкоштовні ресурси
Перегляньте наведені нижче ресурси, щоб дізнатися більше про функції та можливості бібліотеки:
- Керівництво розробника: Dive into the detailed documentation to learn about advanced features and customization options.
- Безкоштовні онлайн-додатки: Experience working applications live!
- Інструкції та статті: Follow step-by-step guides to explore specific use cases and examples.
- Посилання на API: Get detailed information on classes, methods, and parameters.
- Приклади коду: Check out code snippets and sample projects to inspire your next project.
Висновок
У цій публікації блогу ми продемонстрували, як використовувати Aspose.OCR for Python для перетворення тексту із зображень у файли TXT. Дотримуючись наведених вище кроків, ви можете легко інтегрувати функцію оптичного розпізнавання символів у свої програми Python, дозволяючи витягувати та обробляти текст із різних типів зображень. Незалежно від того, чи працюєте ви над оцифруванням документів, вилученням даних чи будь-яким іншим завданням, пов’язаним з OCR, Aspose.OCR надасть надійне та ефективне рішення. Щасливого кодування!
У разі будь-яких неясностей зв’яжіться з нами на нашому безкоштовному форумі підтримки.