Konvertieren Sie DOCX in TXT in Python

MS Word-Formate DOC und DOCX werden häufig zum Erstellen von Rich-Text-Dokumenten verwendet. Sie können Text, Tabellen, Grafiken, Animationen und verschiedene andere Elemente zu DOC/DOCX-Dokumenten hinzufügen. In bestimmten Fällen, z. B. um den Text in Word-Dokumenten zu parsen und zu analysieren, müssen Sie DOC/DOCX-Dateien jedoch programmgesteuert in das TXT-Format konvertieren. Um dies zu erreichen, behandelt dieser Artikel, wie Sie eine DOC- oder DOCX-Datei in Python in das TXT-Format konvertieren.

Bibliothek zum Konvertieren von Python DOC/DOCX in TXT

Um DOC- und DOCX-Dateien im TXT-Format zu speichern, verwenden wir Aspose.Words for Python. Es ist eine leistungsstarke und schnelle Bibliothek, die eine Reihe von Funktionen zum nahtlosen Erstellen und Bearbeiten von Textdokumenten bietet. Darüber hinaus bietet es eine hochwertige Konvertierung von Dokumenten in andere Formate. Sie können die Bibliothek in Ihrer Python-Anwendung von PyPI mit dem folgenden Pip-Befehl installieren.

> pip install aspose-words

Konvertieren Sie DOCX in TXT in Python

Sehen wir uns an, wie man eine DOCX-Datei in Python in TXT konvertiert. Dazu müssen Sie lediglich die DOCX-Datei laden und als TXT-Datei speichern. Im Folgenden sind die Schritte zum Speichern einer DOCX-Datei im TXT-Format in Python aufgeführt.

  • Laden Sie die DOCX-Datei mithilfe der Document-Klasse.
  • Speichern Sie DOCX als TXT mit der Methode Document.save().

Das folgende Codebeispiel zeigt, wie die DOCX-zu-TXT-Konvertierung in Python durchgeführt wird.

import aspose.words as aw

# Laden Sie das DOC/DOCX-Dokument
doc = aw.Document("Input.docx")

# Als TXT speichern
doc.save("Output.txt")

Holen Sie sich eine kostenlose Lizenz

Sie können eine kostenlose temporäre Lizenz erhalten, um Aspose.Words für Python ohne Evaluierungseinschränkungen zu verwenden.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie DOC- oder DOCX-Dateien in Python in das TXT-Format konvertieren. Mit dieser Funktion können Sie den Text aus DOCX-Dateien extrahieren und in Form einer einfachen TXT-Datei speichern. So können Sie den Text bequemer analysieren. Außerdem können Sie mehr über die Bibliothek erfahren, indem Sie die Dokumentation verwenden. Außerdem können Sie Ihre Fragen oder Fragen über unser Forum teilen.

Siehe auch