Konwertuj Word na JSON w Python

W różnych przypadkach musisz wykonać programową konwersję Worda na JSON z poziomu aplikacji Python. Na przykład, aby wyeksportować dane z dokumentu Word i przetworzyć lub przesłać je w formacie JSON. W tym artykule dowiesz się, jak łatwo przekonwertować tekst w dokumencie Word do formatu JSON. Ponadto dowiesz się, jak załadować chroniony dokument Word i programowo przekonwertować go na JSON. Przejdźmy więc do konwersji Worda na JSON w Python.

Jak przekonwertować Worda na JSON w Python

Aby przekonwertować dokument programu Word na format JSON, wykonamy następujące czynności:

  • Załaduj dokument Worda.
  • Przekonwertuj go do formatu HTML.
  • Zapisz plik HTML w formacie JSON.

Zobaczmy, jak programowo zaimplementować te kroki w języku Python. W tym celu najpierw zainstalujemy kilka bibliotek, jak pokazano w poniższej sekcji.

Biblioteki Python do konwersji programu Word na format JSON — bezpłatne pobieranie

Aspose.Words for Python to potężna biblioteka przeznaczona do tworzenia i przetwarzania dokumentów MS Word. Użyjemy tej biblioteki do wyeksportowania zawartości dokumentu programu Word do formatu HTML. Gdy mamy już treść HTML, użyjemy Aspose.Cells for Python, aby zapisać ją jako plik JSON.

Możesz użyć następujących poleceń pip, aby zainstalować obie biblioteki.

pip install aspose-cells
pip install aspose-words

Konwertuj Word na JSON w Python

Poniżej przedstawiono kroki konwersji programu Word na format JSON w języku Python.

  • Załaduj dokument programu Word, używając klasy Document klasy Aspose.Words.
  • Zapisz dokument programu Word jako HTML przy użyciu metody Document.save().
  • Załaduj plik HTML przy użyciu klasy Workbook Aspose.Cells.
  • Konwertuj dokument do formatu JSON za pomocą metody Workbook.save().

Poniższy przykładowy kod pokazuje, jak przekonwertować dokument programu Word na format JSON w języku Python.

# Załaduj dokument
doc = aw.Document("document1.docx")

# Zapisz dokument w formacie HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Załaduj plik HTML w instancji klasy Workbook
book = Workbook("html_output.html")

# Zapisz jako JSON
book.save("word-to-json.json", SaveFormat.JSON)

Konwertuj chronione słowo na JSON w Python

Możesz także załadować chronione dokumenty Worda za pomocą ich haseł i przekonwertować je na format JSON. Poniżej przedstawiono kroki konwersji chronionego dokumentu programu Word na format JSON w języku Python.

  • Załaduj dokument programu Word, używając klasy Document klasy Aspose.Words.
  • Użyj klasy LoadOptions Aspose.Words, aby określić hasło do chronionego dokumentu programu Word.
  • Zapisz dokument programu Word jako HTML przy użyciu metody Document.save().
  • Załaduj plik HTML przy użyciu klasy Workbook Aspose.Cells.
  • Konwertuj dokument do formatu JSON za pomocą metody Workbook.save().

Poniższy przykładowy kod pokazuje, jak przekonwertować chroniony dokument programu Word na format JSON w języku Python.

# Załaduj chroniony dokument za pomocą LoadOptions
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# Zapisz dokument w formacie HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Załaduj plik HTML w instancji klasy Workbook
book = Workbook("html_output.html")

# Zapisz jako JSON
book.save("word-to-json.json", SaveFormat.JSON)

Python Word to JSON Converter Biblioteki — Uzyskaj bezpłatną licencję

Możesz uzyskać bezpłatną licencję tymczasową na korzystanie z bibliotek bez ograniczeń ewaluacyjnych.

Wniosek

W tym artykule nauczyłeś się, jak przekonwertować Word na JSON w Python. Ponadto widziałeś, jak programowo przekonwertować dokument programu Word chroniony hasłem na format JSON. Poza tym możesz odwiedzić dokumentację Aspose.Words for Python i Aspose.Cells for Python, aby dowiedzieć się więcej o bibliotekach. Jeśli masz jakieś pytania, daj nam znać za pośrednictwem naszego forum.

Zobacz też