Ви втомилися вручну транскрибувати текст із зображень? Якщо у вас є колекція відсканованих документів, скріншотів або зображень, що містять текст, який ви хочете редагувати, не шукайте далі! Ви можете легко розпізнати зображення JPG або PNG і витягнути текст. У цій публікації блогу ми розглянемо, як конвертувати текст зображення в документи Word на Python, щоб полегшити роботу з текстовими даними та маніпулювання ними. Цей посібник допоможе вам легко витягнути текст із зображень і покаже, як зберегти його у форматі DOCX.
Ця стаття охоплює такі теми:
- Бібліотека OCR Python для перетворення тексту зображень у Word
- Перетворіть зображення Текстове зображення у Word
- Текст із зображень у Word – безкоштовні ресурси
- Отримайте безкоштовну ліцензію
Текст із зображень у Word за допомогою бібліотеки OCR Python
Ми використаємо Aspose.OCR for Python, щоб перетворити текст зображення у Word на Python. Це потужний і ефективний інструмент для вилучення тексту із зображень і перетворення його на редаговані документи Word. Завдяки передовій технології OCR він точно розпізнає та витягує текст із різних форматів зображень, включаючи скановані документи, фотографії та знімки екрана.
Завантажте пакет або встановіть API з PyPI за допомогою такої команди pip у консолі:
pip install aspose-ocr-python-net
Перетворення тексту зображення на Word у Python
Ми можемо легко розпізнати та прочитати текст із зображення та перетворити його на документ Word. Виконайте наведені нижче дії, щоб програмно видобути та відредагувати текст із зображень.
- Ініціалізуйте об’єкт класу OcrInput за допомогою InputType.SINGLEIMAGE як аргумент.
- Додайте зображення за допомогою методу add().
- Створіть екземпляр об’єкта класу AsposeOcr.
- Після цього викличте метод розпізнавання() з об’єктом OcrInput як аргументом.
- Нарешті збережіть результат як файл DOCX за допомогою методу save().
У наведеному нижче прикладі коду показано, як перетворити текст зображення на документ Word у Python.
# Цей приклад коду демонструє, як перетворити текст зображення у Word на Python!
import aspose.ocr as ocr
# Додайте зображення до пакету розпізнавання
inputImg = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
inputImg.add("sample.jpg")
# Створення екземпляра Aspose.OCR API
api = ocr.AsposeOcr()
# Впізнай зображення
result = api.recognize(inputImg)
# Результат розпізнавання друку
print(result[0].recognition_text)
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX);
Текст із зображень у Word – безкоштовні ресурси
Хочете зробити більше з перетворенням тексту зображення на Word у Python? Перегляньте наведені нижче ресурси, щоб дізнатися більше про функції бібліотеки та побачити, що ще ви можете зробити!
Бібліотека OCR Python – отримайте безкоштовну ліцензію
Почніть безкоштовно конвертувати текст зображення у Word! Відвідайте сторінку «Тимчасова ліцензія», щоб дізнатися, як легко отримати безкоштовну тимчасову ліцензію, щоб ви могли спробувати бібліотеку без будь-яких обмежень.
Висновок
У цій публікації блогу ми досліджували, як перетворити текст зображення на редаговані документи Word. Використовуючи Aspose.OCR for Python, ми можемо ефективно витягувати текст із зображень і перетворювати його у формат Word, заощаджуючи час і підвищуючи продуктивність. Бібліотека підтримує понад 100 мов і пропонує гнучкі параметри виводу, що робить її популярним вибором для розробників і компаній, які прагнуть автоматизувати завдання обробки документів. За допомогою кроків, описаних у цьому посібнику, ви можете програмно витягувати текст із зображень, автоматизувати завдання обробки документів, отримувати дані зі сканованих документів тощо. Тож продовжуйте, спробуйте та розкрийте потенціал перетворення зображення в текст у своїх проектах!
У разі будь-яких неясностей зв’яжіться з нами на нашому безкоштовному форумі підтримки.