La conversione del testo dalle immagini in formati modificabili è un compito cruciale per varie applicazioni. Che tu stia lavorando con documenti scansionati, biglietti da visita o appunti scritti a mano, l’estrazione del testo dalle immagini può farti risparmiare tempo e aumentare la produttività in modo significativo. In questo post del blog impareremo come convertire il testo da immagini a testo in Python.
Questo articolo tratta i seguenti argomenti:
- Convertitore da testo a testo di immagini Python
- Converti testo da immagine a testo in Python
- Testo da immagine a testo - Metodo avanzato
- Risorse gratuite
- Ottieni una licenza gratuita
Convertitore da testo a testo di immagini Python
Utilizzeremo Aspose.OCR for Python per convertire il testo da immagini a testo (TXT).Aspose.OCR for Python è una potente libreria di riconoscimento ottico dei caratteri (OCR) che consente agli sviluppatori di estrarre testo da immagini e documenti scansionati nelle applicazioni Python.
Innanzitutto, dobbiamo installare la libreria Aspose.OCR. Puoi facilmente scaricare il pacchetto o installare l’API da PyPI utilizzando il seguente comando pip nella console:
pip install aspose-ocr-python-net
Converti testo da immagine a testo in Python
Possiamo convertire il testo da un’immagine e salvarlo in un file di testo (TXT).Seguire i passaggi seguenti per estrarre a livello di codice il testo dalle immagini e salvarlo come file di testo.
- Crea un’istanza dell’oggetto della classe AsposeOcr.
- Istanziare l’oggetto della classe OcrInput con InputType.SINGLEIMAGE come argomento.
- Aggiungi l’immagine utilizzando il metodo add().Allo stesso modo, aggiungi più immagini.
- Successivamente, chiama il metodo aware() con l’oggetto OcrInput come argomento.
- Infine, salva il risultato come file di testo utilizzando il metodo save().
L’esempio di codice seguente mostra come convertire il testo da un’immagine in un file di testo in Python.
# Questo esempio di codice mostra come estrarre il testo da un'immagine e salvarlo come file di testo in Python
import aspose.ocr as ocr
# Crea un'istanza dell'API Aspose.OCR
api = ocr.AsposeOcr()
# Aggiungi l'immagine al batch di riconoscimento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")
# Riconoscere l'immagine
result = api.recognize(img)
# Stampa il risultato del riconoscimento
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Testo da immagine a testo - Metodo avanzato
Allo stesso modo, possiamo aggiungere filtri come “autoskew” e impostare opzioni di riconoscimento come modalità area, lingua, ecc. durante la conversione del testo da immagini a file di testo. Segui i passaggi seguenti per aggiungere filtri e impostazioni di riconoscimento.
- Crea un’istanza dell’oggetto della classe AsposeOcr.
- Inizializza un oggetto della classe PreprocessingFilters.
- Aggiungi i filtri usando il metodo add().
- Istanziare l’oggetto della classe OcrInput con InputType.SINGLEIMAGE e filtrare l’oggetto come argomenti.
- Aggiungi l’immagine utilizzando il metodo add().Allo stesso modo, aggiungi più immagini.
- Inizializza l’oggetto della classe RecognitionSettings.
- Specificare le opzioni di riconoscimento.
- Successivamente, chiama il metodo aware() con l’oggetto OcrInput come argomento.
- Infine, salva il risultato come file di testo utilizzando il metodo save().
L’esempio di codice seguente mostra come specificare filtri e impostazioni di riconoscimento per convertire il testo da un’immagine a un file di testo in Python.
# Questo esempio di codice mostra come estrarre il testo in lingua inglese da un'immagine e salvarlo come file di testo in Python
import aspose.ocr as ocr
# Crea un'istanza dell'API Aspose.OCR
api = ocr.AsposeOcr()
# impostare le opzioni di preelaborazione
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())
# Aggiungi l'immagine al batch di riconoscimento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")
# Imposta le opzioni di riconoscimento
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG
# Riconoscere
result = api.recognize(img, settings)
# Stampa il risultato del riconoscimento
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);
Libreria OCR Python: ottieni una licenza gratuita
Visita la nostra pagina “Licenza temporanea” per scoprire come ottenere una licenza gratuita e sbloccare facilmente l’accesso illimitato alla libreria OCR Python. Inizia oggi stesso a convertire il testo da immagini a file di testo!
Convertitore di immagini da testo a testo: risorse gratuite
Esplora le risorse di seguito per scoprire di più sulle caratteristiche e le capacità della libreria:
- Guida per gli sviluppatori: Dive into the detailed documentation to learn about advanced features and customization options.
- Applicazioni online gratuite: Experience working applications live!
- Guide e articoli pratici: Follow step-by-step guides to explore specific use cases and examples.
- Riferimento API: Get detailed information on classes, methods, and parameters.
- Esempi di codici: Check out code snippets and sample projects to inspire your next project.
Conclusione
In questo post del blog, abbiamo dimostrato come utilizzare Aspose.OCR for Python per convertire testo da immagini in file TXT. Seguendo i passaggi sopra descritti, puoi facilmente integrare la funzionalità OCR nelle tue applicazioni Python, consentendoti di estrarre ed elaborare testo da vari tipi di immagini. Sia che tu stia lavorando sulla digitalizzazione di documenti, sull’estrazione di dati o su qualsiasi altra attività relativa all’OCR, Aspose.OCR fornisce una soluzione affidabile ed efficiente. Buona programmazione!
In caso di ambiguità, non esitate a contattarci sul nostro forum di supporto gratuito.