Dieser Artikel bietet die einfachste Möglichkeit zum Extrahieren von Klartext aus den Word DOCX oder DOC Dateien in Ihren Python-Anwendungen. Nachdem Sie diesen Artikel gelesen haben, erfahren Sie, wie Sie eine DOCX oder DOC-Datei in Python in TXT konvertieren.

Konvertieren Sie DOC DOCX in Python in TXT

MS Word ist eine beliebte Textverarbeitungsanwendung, mit der Sie Rich-Text Dokumente erstellen können. Eine Vielzahl von Dokumenten wird in MS Word erstellt, darunter Rechnungen, technische Dokumente, Berichte usw. DOC und DOCX sind die Dateiformate, die MS Word zum Speichern der Dokumente verwendet.

Als Programmierer müssen Sie möglicherweise eine Reihe von Word-DOC/DOCX Dateien verarbeiten, um den Klartext aus Ihren Python-Anwendungen zu extrahieren. Sehen wir uns also an, wie man eine DOC oder DOCX zu TXT-Konvertierung in Python durchführt.

Python-DOCX zu TXT-Konverter – kostenloser Download

Aspose.Words for Python ist eine erstaunliche Bibliothek mit einer Vielzahl von Funktionen zur Bearbeitung beliebter Textdokumente, einschließlich DOC und DOCX. Die Bibliothek erleichtert die Verarbeitung und das Abrufen von Text aus den Word Dokumenten. Daher werden wir diese Bibliothek verwenden, um die DOC/DOCX Dateien in das TXT-Format zu konvertieren.

Sie können den folgenden Pip-Befehl verwenden, um Aspose.Words for Python in Ihrer Anwendung zu installieren.

pip install aspose-words

So konvertieren Sie DOCX in TXT in Python

Aspose.Words for Python vereinfacht die DOCX zu TXT-Konvertierung, die Sie wie unten erwähnt in wenigen Schritten durchführen können:

  • Laden Sie die DOCX-Datei von der Festplatte.
  • Speichern Sie DOCX im TXT-Format am gewünschten Ort.

Sie müssen nicht das gesamte Word Dokument Seite für Seite oder Zeile für Zeile parsen, um den Text daraus zu extrahieren. Sehen wir uns nun an, wie Sie diese Schritte in Python ausführen, um eine DOCX-Datei in das TXT-Format zu konvertieren.

Speichern Sie DOC als TXT in Python

Im Folgenden sind die Schritte zum Speichern einer DOC oder DOCX-Datei als TXT in Python aufgeführt.

  • Laden Sie die DOC-Datei mithilfe der Document Klasse.
  • Speichern Sie DOC als TXT mit der Methode Document.save(filePath) und übergeben Sie den Pfad der Datei als Parameter.

Das folgende Codebeispiel zeigt, wie Sie in Python ein DOC in TXT konvertieren.

import aspose.words as aw

# DOC-Datei laden
doc = aw.Document("document.doc")

# DOC als TXT speichern
doc.save("doc-to-text.txt")

Python DOC to TXT Converter - Holen Sie sich eine kostenlose Lizenz

Sie können eine kostenlose temporäre Lizenz verwenden, um DOC Dateien ohne Evaluierungseinschränkungen in das TXT-Format zu konvertieren.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie DOC oder DOCX Dateien in Python in das TXT-Format konvertieren. Mit Hilfe des Codebeispiels haben Sie gesehen, wie Sie DOCX Dateien als TXT am gewünschten Ort in Python laden und speichern. Außerdem können Sie die Dokumentation von Aspose.Words for Python besuchen, um mehr über die Bibliothek zu erfahren. Falls Sie Fragen haben, können Sie uns diese gerne über unser Forum mitteilen.

Siehe auch