Text von Bild zu Text in Python | Python bildtext zu Text

Das Konvertieren von Text aus Bildern in bearbeitbare Formate ist für verschiedene Anwendungen eine wichtige Aufgabe. Egal, ob Sie mit gescannten Dokumenten, Visitenkarten oder handschriftlichen Notizen arbeiten, das Extrahieren von Text aus Bildern kann erheblich Zeit sparen und die Produktivität steigern. In diesem Blogbeitrag erfahren Sie, wie Sie Text aus Bildern in Python in Text konvertieren.

In diesem Artikel werden die folgenden Themen behandelt:

Python bildtext zu Text-Konverter

Wir werden Aspose.OCR for Python verwenden, um Text aus Bildern in Text (TXT) umzuwandeln. Aspose.OCR for Python ist eine leistungsstarke OCR-Bibliothek (Optical Character Recognition), mit der Entwickler in Python-Anwendungen Text aus Bildern und gescannten Dokumenten extrahieren können.

Zuerst müssen wir die Aspose.OCR-Bibliothek installieren. Sie können das Paket ganz einfach herunterladen oder die API von PyPI mit dem folgenden Pip-Befehl in der Konsole installieren:

pip install aspose-ocr-python-net 

Text aus Bildern in Text in Python konvertieren

Wir können Text aus einem Bild konvertieren und ihn in einer Textdatei (TXT) speichern. Befolgen Sie die nachstehenden Schritte, um Text programmgesteuert aus Bildern zu extrahieren und als Textdatei zu speichern.

  1. Erstellen Sie eine Instanz des Klassenobjekts AsposeOcr.
  2. Instanziieren Sie das Objekt der Klasse OcrInput mit InputType.SINGLEIMAGE als Argument.
  3. Fügen Sie das Bild mit der Methode add() hinzu. Fügen Sie auf ähnliche Weise weitere Bilder hinzu.
  4. Rufen Sie anschließend die Methode recognize() mit dem OcrInput Objekt als Argument auf.
  5. Speichern Sie das Ergebnis abschließend mit der Methode save() als Textdatei.

Das folgende Codebeispiel zeigt, wie Sie in Python Text aus einem Bild in eine Textdatei konvertieren.

# Dieses Codebeispiel zeigt, wie man in Python Text aus einem Bild extrahiert und als Textdatei speichert
import aspose.ocr as ocr

# Instanziieren Sie die Aspose.OCR-API
api = ocr.AsposeOcr()

# Bild zum Erkennungsstapel hinzufügen
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")

# Erkenne das Bild
result = api.recognize(img)

# Druckerkennungsergebnis
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Text von Bild zu Text-Konverter in Python.

Text von Bild zu Text-Konverter in Python.

Text aus Bild zu Text - Erweiterte Methode

Ebenso können wir Filter wie „Autoskew“ hinzufügen und Erkennungsoptionen wie Bereichsmodi, Sprache usw. festlegen, während wir Text aus Bildern in Textdateien konvertieren. Befolgen Sie die nachstehenden Schritte, um Filter und Erkennungseinstellungen hinzuzufügen.

  1. Erstellen Sie eine Instanz des Klassenobjekts AsposeOcr.
  2. Initialisieren Sie ein Objekt der Klasse PreprocessingFilters.
  3. Fügen Sie die Filter mit der Methode add() hinzu.
  4. Instanziieren Sie das Objekt der Klasse OcrInput mit InputType.SINGLEIMAGE und Filterobjekten als Argumente.
  5. Fügen Sie das Bild mit der Methode add() hinzu. Fügen Sie auf ähnliche Weise weitere Bilder hinzu.
  6. Initialisieren Sie das Objekt der Klasse RecognitionSettings.
  7. Geben Sie Erkennungsoptionen an.
  8. Rufen Sie anschließend die Methode recognize() mit dem OcrInput Objekt als Argument auf.
  9. Speichern Sie das Ergebnis abschließend mit der Methode save() als Textdatei.

Das folgende Codebeispiel zeigt, wie Filter und Erkennungseinstellungen zum Konvertieren von Text aus einem Bild in eine Textdatei in Python angegeben werden.

# Dieses Codebeispiel zeigt, wie man englischsprachigen Text aus einem Bild extrahiert und in Python als Textdatei speichert
import aspose.ocr as ocr

# Instanziieren Sie die Aspose.OCR-API
api = ocr.AsposeOcr()

# Vorverarbeitungsoptionen festlegen
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())

# Bild zum Erkennungsstapel hinzufügen
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")

# Festlegen von Erkennungsoptionen
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG

# Erkenne
result = api.recognize(img, settings)

# Druckerkennungsergebnis
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);

Python OCR-Bibliothek – Holen Sie sich eine kostenlose Lizenz

Besuchen Sie unsere Seite „Temporäre Lizenz“, um zu erfahren, wie Sie ganz einfach eine kostenlose Lizenz erhalten und unbegrenzten Zugriff auf die Python OCR-Bibliothek freischalten können. Beginnen Sie noch heute mit der Konvertierung von Text aus Bildern in Textdateien!

Bildtext zu Text-Konverter – Kostenlose Ressourcen

Erkunden Sie die folgenden Ressourcen, um mehr über die Funktionen und Möglichkeiten der Bibliothek zu erfahren:

Abschluss

In diesem Blogbeitrag haben wir gezeigt, wie Sie mit Aspose.OCR for Python Text aus Bildern in TXT Dateien konvertieren. Wenn Sie die oben beschriebenen Schritte befolgen, können Sie die OCR funktionalität problemlos in Ihre Python-Anwendungen integrieren und so Text aus verschiedenen Bildtypen extrahieren und verarbeiten. Egal, ob Sie an der Digitalisierung von Dokumenten, der Datenextraktion oder einer anderen OCR-bezogenen Aufgabe arbeiten, Aspose.OCR bietet eine zuverlässige und effiziente Lösung. Viel Spaß beim Programmieren!

Bei Unklarheiten können Sie uns gerne über unser kostenloses Support-Forum kontaktieren.

Siehe auch