Das Konvertieren von Text aus Bildern in bearbeitbare Formate ist für verschiedene Anwendungen eine wichtige Aufgabe. Egal, ob Sie mit gescannten Dokumenten, Visitenkarten oder handschriftlichen Notizen arbeiten, das Extrahieren von Text aus Bildern kann erheblich Zeit sparen und die Produktivität steigern. In diesem Blogbeitrag erfahren Sie, wie Sie Text aus Bildern in Python in Text konvertieren.
In diesem Artikel werden die folgenden Themen behandelt:
- Python bildtext zu Text-Konverter
- Text aus Bildern in Text in Python konvertieren
- Text aus Bild zu Text - Erweiterte Methode
- Kostenlose Ressourcen
- Holen Sie sich eine kostenlose Lizenz
Python bildtext zu Text-Konverter
Wir werden Aspose.OCR for Python verwenden, um Text aus Bildern in Text (TXT) umzuwandeln. Aspose.OCR for Python ist eine leistungsstarke OCR-Bibliothek (Optical Character Recognition), mit der Entwickler in Python-Anwendungen Text aus Bildern und gescannten Dokumenten extrahieren können.
Zuerst müssen wir die Aspose.OCR-Bibliothek installieren. Sie können das Paket ganz einfach herunterladen oder die API von PyPI mit dem folgenden Pip-Befehl in der Konsole installieren:
pip install aspose-ocr-python-net
Text aus Bildern in Text in Python konvertieren
Wir können Text aus einem Bild konvertieren und ihn in einer Textdatei (TXT) speichern. Befolgen Sie die nachstehenden Schritte, um Text programmgesteuert aus Bildern zu extrahieren und als Textdatei zu speichern.
- Erstellen Sie eine Instanz des Klassenobjekts AsposeOcr.
- Instanziieren Sie das Objekt der Klasse OcrInput mit InputType.SINGLEIMAGE als Argument.
- Fügen Sie das Bild mit der Methode add() hinzu. Fügen Sie auf ähnliche Weise weitere Bilder hinzu.
- Rufen Sie anschließend die Methode recognize() mit dem OcrInput Objekt als Argument auf.
- Speichern Sie das Ergebnis abschließend mit der Methode save() als Textdatei.
Das folgende Codebeispiel zeigt, wie Sie in Python Text aus einem Bild in eine Textdatei konvertieren.
# Dieses Codebeispiel zeigt, wie man in Python Text aus einem Bild extrahiert und als Textdatei speichert
import aspose.ocr as ocr
# Instanziieren Sie die Aspose.OCR-API
api = ocr.AsposeOcr()
# Bild zum Erkennungsstapel hinzufügen
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")
# Erkenne das Bild
result = api.recognize(img)
# Druckerkennungsergebnis
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Text aus Bild zu Text - Erweiterte Methode
Ebenso können wir Filter wie „Autoskew“ hinzufügen und Erkennungsoptionen wie Bereichsmodi, Sprache usw. festlegen, während wir Text aus Bildern in Textdateien konvertieren. Befolgen Sie die nachstehenden Schritte, um Filter und Erkennungseinstellungen hinzuzufügen.
- Erstellen Sie eine Instanz des Klassenobjekts AsposeOcr.
- Initialisieren Sie ein Objekt der Klasse PreprocessingFilters.
- Fügen Sie die Filter mit der Methode add() hinzu.
- Instanziieren Sie das Objekt der Klasse OcrInput mit InputType.SINGLEIMAGE und Filterobjekten als Argumente.
- Fügen Sie das Bild mit der Methode add() hinzu. Fügen Sie auf ähnliche Weise weitere Bilder hinzu.
- Initialisieren Sie das Objekt der Klasse RecognitionSettings.
- Geben Sie Erkennungsoptionen an.
- Rufen Sie anschließend die Methode recognize() mit dem OcrInput Objekt als Argument auf.
- Speichern Sie das Ergebnis abschließend mit der Methode save() als Textdatei.
Das folgende Codebeispiel zeigt, wie Filter und Erkennungseinstellungen zum Konvertieren von Text aus einem Bild in eine Textdatei in Python angegeben werden.
# Dieses Codebeispiel zeigt, wie man englischsprachigen Text aus einem Bild extrahiert und in Python als Textdatei speichert
import aspose.ocr as ocr
# Instanziieren Sie die Aspose.OCR-API
api = ocr.AsposeOcr()
# Vorverarbeitungsoptionen festlegen
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())
# Bild zum Erkennungsstapel hinzufügen
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")
# Festlegen von Erkennungsoptionen
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG
# Erkenne
result = api.recognize(img, settings)
# Druckerkennungsergebnis
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);
Python OCR-Bibliothek – Holen Sie sich eine kostenlose Lizenz
Besuchen Sie unsere Seite „Temporäre Lizenz“, um zu erfahren, wie Sie ganz einfach eine kostenlose Lizenz erhalten und unbegrenzten Zugriff auf die Python OCR-Bibliothek freischalten können. Beginnen Sie noch heute mit der Konvertierung von Text aus Bildern in Textdateien!
Bildtext zu Text-Konverter – Kostenlose Ressourcen
Erkunden Sie die folgenden Ressourcen, um mehr über die Funktionen und Möglichkeiten der Bibliothek zu erfahren:
- Entwicklerhandbuch: Dive into the detailed documentation to learn about advanced features and customization options.
- Kostenlose Online-Bewerbungen: Experience working applications live!
- Anleitungen und Artikel: Follow step-by-step guides to explore specific use cases and examples.
- API-Referenz: Get detailed information on classes, methods, and parameters.
- Codebeispiele: Check out code snippets and sample projects to inspire your next project.
Abschluss
In diesem Blogbeitrag haben wir gezeigt, wie Sie mit Aspose.OCR for Python Text aus Bildern in TXT Dateien konvertieren. Wenn Sie die oben beschriebenen Schritte befolgen, können Sie die OCR funktionalität problemlos in Ihre Python-Anwendungen integrieren und so Text aus verschiedenen Bildtypen extrahieren und verarbeiten. Egal, ob Sie an der Digitalisierung von Dokumenten, der Datenextraktion oder einer anderen OCR-bezogenen Aufgabe arbeiten, Aspose.OCR bietet eine zuverlässige und effiziente Lösung. Viel Spaß beim Programmieren!
Bei Unklarheiten können Sie uns gerne über unser kostenloses Support-Forum kontaktieren.