Konvertieren Sie Word in Python in JSON

In verschiedenen Fällen müssen Sie die Word zu JSON-Konvertierung programmgesteuert aus Ihrer Python-Anwendung heraus durchführen. Beispielsweise um die Daten aus einem Word Dokument zu exportieren und im JSON-Format zu verarbeiten oder zu transportieren. In diesem Artikel erfahren Sie, wie Sie den Text in einem Word Dokument einfach in das JSON-Format konvertieren. Außerdem erfahren Sie, wie Sie ein geschütztes Word Dokument laden und programmgesteuert in JSON konvertieren. Lassen Sie uns also fortfahren, Word in Python in JSON zu konvertieren.

So konvertieren Sie Word in Python in JSON

Um ein Word Dokument in das JSON-Format zu konvertieren, führen wir die folgenden Schritte aus:

  • Laden Sie das Word Dokument.
  • Konvertieren Sie es in das HTML-Format.
  • Speichern Sie die HTML-Datei im JSON-Format.

Sehen wir uns an, wie diese Schritte programmgesteuert in Python implementiert werden. Dazu werden wir zunächst ein paar Bibliotheken installieren, wie im folgenden Abschnitt gezeigt wird.

Python Bibliotheken zum Konvertieren von Word in JSON – kostenloser Download

Aspose.Words for Python ist eine leistungsstarke Bibliothek zum Erstellen und Verarbeiten von MS Word Dokumenten. Wir werden diese Bibliothek verwenden, um den Inhalt eines Word Dokuments in HTML zu exportieren. Sobald wir den HTML-Inhalt haben, verwenden wir Aspose.Cells for Python, um ihn als JSON-Datei zu speichern.

Sie können die folgenden Pip-Befehle verwenden, um beide Bibliotheken zu installieren.

pip install aspose-cells
pip install aspose-words

Konvertieren Sie Word in Python in JSON

Im Folgenden sind die Schritte zum Konvertieren von Word in JSON in Python aufgeführt.

  • Laden Sie das Word Dokument mithilfe der Document Klasse von Aspose.Words.
  • Speichern Sie das Word Dokument als HTML mit der Methode Document.save().
  • Laden Sie die HTML-Datei mit der Workbook Klasse von Aspose.Cells.
  • Konvertieren Sie das Dokument mit der Methode Workbook.save() in das JSON-Format.

Das folgende Codebeispiel zeigt, wie Sie ein Word Dokument in Python in JSON konvertieren.

# Dokument laden
doc = aw.Document("document1.docx")

# Dokument im HTML-Format speichern
doc.save("html_output.html", aw.SaveFormat.HTML)

# Laden Sie die HTML-Datei in eine Instanz der Workbook Klasse
book = Workbook("html_output.html")

# Als JSON speichern
book.save("word-to-json.json", SaveFormat.JSON)

Konvertieren Sie geschütztes Word in Python in JSON

Sie können die geschützten Word Dokumente auch mit ihren Passwörtern laden und in das JSON-Format konvertieren. Im Folgenden sind die Schritte zum Konvertieren eines geschützten Word Dokuments in JSON in Python aufgeführt.

  • Laden Sie das Word Dokument mithilfe der Document Klasse von Aspose.Words.
  • Verwenden Sie die LoadOptions Klasse von Aspose.Words, um das Kennwort des geschützten Word Dokuments anzugeben.
  • Speichern Sie das Word Dokument als HTML mit der Methode Document.save().
  • Laden Sie die HTML-Datei mit der Workbook Klasse von Aspose.Cells.
  • Konvertieren Sie das Dokument mit der Methode Workbook.save() in das JSON-Format.

Das folgende Codebeispiel zeigt, wie Sie ein geschütztes Word Dokument in Python in JSON konvertieren.

# Geschütztes Dokument mit LoadOptions laden
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# Dokument im HTML-Format speichern
doc.save("html_output.html", aw.SaveFormat.HTML)

# Laden Sie die HTML-Datei in eine Instanz der Workbook Klasse
book = Workbook("html_output.html")

# Als JSON speichern
book.save("word-to-json.json", SaveFormat.JSON)

Python Word to JSON Converter Libraries – Holen Sie sich eine kostenlose Lizenz

Sie können eine kostenlose temporäre Lizenz erwerben, um die Bibliotheken ohne Evaluierungseinschränkungen zu nutzen.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie Word in Python in JSON konvertieren. Außerdem haben Sie gesehen, wie Sie ein passwortgeschütztes Word Dokument programmgesteuert in JSON konvertieren. Außerdem können Sie die Dokumentation von Aspose.Words for Python und Aspose.Cells for Python aufrufen, um mehr über die Bibliotheken zu erfahren. Falls Sie Fragen haben, können Sie uns diese gerne über unser Forum mitteilen.

Siehe auch