對於各種應用程式來說,將文字從圖像轉換為可編輯格式是一項至關重要的任務。無論您是處理掃描文件、名片還是手寫筆記,從圖像中提取文字都可以顯著節省時間並提高工作效率。在這篇文章中,我們將學習如何在 Python 中將文字從圖像轉換為文字。
本文涵蓋以下主題:
Python 圖像文字到文字轉換器
我們將使用 Aspose.OCR for Python 將文字從圖像轉換為文字 (TXT)。 Aspose.OCR for Python 是一個強大的光學字元辨識 (OCR) 函式庫,可讓開發人員在 Python 應用程式中從影像和掃描文件中提取文字。
首先,我們需要安裝Aspose.OCR函式庫。您可以在控制台中使用以下 pip 命令輕鬆地下載軟體包或從 PyPI 安裝 API:
pip install aspose-ocr-python-net
在 Python 中將文字從圖像轉換為文字
我們可以將圖像轉換為文字並將其儲存到文字 (TXT) 檔案。請按照以下步驟以程式設計方式從圖像中提取文字並將其儲存為文字檔案。
- 建立 AsposeOcr 類別物件的實例。
- 使用 InputType.SINGLEIMAGE 作為參數實例化 OcrInput 類別物件。
- 使用 add() 方法新增圖像。同樣,添加更多圖像。
- 之後,以 OcrInput 物件作為參數呼叫 recognize() 方法。
- 最後,使用 save() 方法將結果儲存為文字檔。
以下程式碼範例示範如何在 Python 中將圖像中的文字轉換為文字檔案。
# 此程式碼範例展示如何在 Python 中從圖像中提取文字並另存為文字文件
import aspose.ocr as ocr
# 實例化 Aspose.OCR API
api = ocr.AsposeOcr()
# 將影像新增至辨識批次中
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")
# 辨識影像
result = api.recognize(img)
# 列印識別結果
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
從圖像到文字的文字 - 高級方法
同樣,我們可以在將文字從圖像轉換為文字檔案時添加“自動傾斜”等過濾器並設定區域模式、語言等識別選項。請依照以下步驟新增過濾器和識別設定。
- 建立 AsposeOcr 類別物件的實例。
- 初始化 PreprocessingFilters 類別的物件。
- 使用 add() 方法新增過濾器。
- 使用 InputType.SINGLEIMAGE 和篩選器物件作為參數實例化 OcrInput 類別物件。
- 使用 add() 方法新增圖像。同樣,添加更多圖像。
- 初始化 RecognitionSettings 類別物件。
- 指定識別選項。
- 之後,以 OcrInput 物件作為參數呼叫 recognize() 方法。
- 最後,使用 save() 方法將結果儲存為文字檔。
以下程式碼範例示範如何指定過濾器和識別設置,以便在 Python 中將文字從圖像轉換為文字檔案。
# 此程式碼範例展示如何在 Python 中從圖像中提取英語文字並另存為文字文件
import aspose.ocr as ocr
# 實例化 Aspose.OCR API
api = ocr.AsposeOcr()
# 設定預處理選項
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())
# 將影像新增至辨識批次中
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")
# 設定識別選項
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG
# 認出
result = api.recognize(img, settings)
# 列印識別結果
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);
Python OCR 庫 – 取得免費許可證
請造訪我們的「臨時許可證」頁面,了解如何輕鬆取得免費許可證並解鎖對 Python OCR 庫的無限存取。立即開始將文字從圖像轉換為文字檔案!
圖像文字到文字轉換器 - 免費資源
探索以下資源以了解有關該程式庫的特性和功能的更多資訊:
- 開發者指南: Dive into the detailed documentation to learn about advanced features and customization options.
- 免費線上申請: Experience working applications live!
- 操作指南和文章: Follow step-by-step guides to explore specific use cases and examples.
- API參考: Get detailed information on classes, methods, and parameters.
- 程式碼範例: Check out code snippets and sample projects to inspire your next project.
結論
在這篇文章中,我們示範如何使用 Aspose.OCR for Python 將文字從圖片轉換為 TXT 檔案。透過執行上述步驟,您可以輕鬆地將 OCR 功能整合到 Python 應用程式中,從而能夠從各種類型的圖像中提取和處理文字。無論您是從事文件數位化、資料擷取或任何其他 OCR 相關任務,Aspose.OCR 都能提供可靠且高效的解決方案。快樂編碼!
如有任何疑問,請隨時透過我們的免費支援論壇與我們聯繫。