Konvertera Word till JSON i Python

I olika fall måste du utföra Word till JSON-konvertering programmatiskt från din Python-applikation. Till exempel för att exportera data från ett Word-dokument och bearbeta eller transportera den i JSON-format. I den här artikeln kommer du att lära dig hur du enkelt konverterar texten i ett Word-dokument till JSON-format. Dessutom kommer du att lära dig hur du laddar ett skyddat Word-dokument och konverterar det till JSON programmatiskt. Så låt oss fortsätta att konvertera Word till JSON i Python.

Hur man konverterar Word till JSON i Python

För att konvertera ett Word-dokument till JSON-format kommer vi att utföra följande steg:

  • Ladda Word-dokumentet.
  • Konvertera det till HTML-format.
  • Spara HTML-fil i JSON-format.

Låt oss se hur man implementerar dessa steg programmatiskt i Python. För detta kommer vi först att installera ett par bibliotek, som visas i följande avsnitt.

Python-bibliotek för att konvertera Word till JSON - Gratis nedladdning

Aspose.Words for Python är ett kraftfullt bibliotek som är designat för att skapa och bearbeta MS Word-dokument. Vi kommer att använda det här biblioteket för att exportera innehållet i ett Word-dokument till HTML. När vi har HTML-innehållet kommer vi att använda Aspose.Cells for Python för att spara det som en JSON-fil.

Du kan använda följande pip-kommandon för att installera båda biblioteken.

pip install aspose-cells
pip install aspose-words

Konvertera Word till JSON i Python

Följande är stegen för att konvertera Word till JSON i Python.

  • Ladda Word-dokumentet med Document-klassen Aspose.Words.
  • Spara Word-dokument som HTML med metoden Document.save().
  • Ladda HTML-fil med Workbook-klassen Aspose.Cells.
  • Konvertera dokument till JSON-format med metoden Workbook.save().

Följande kodexempel visar hur man konverterar ett Word-dokument till JSON i Python.

# Ladda dokument
doc = aw.Document("document1.docx")

# Spara dokument i HTML-format
doc.save("html_output.html", aw.SaveFormat.HTML)

# Ladda HTML-filen i en instans av Workbook-klassen
book = Workbook("html_output.html")

# Spara som JSON
book.save("word-to-json.json", SaveFormat.JSON)

Konvertera skyddat Word till JSON i Python

Du kan också ladda de skyddade Word-dokumenten med deras lösenord och konvertera dem till JSON-format. Följande är stegen för att konvertera ett skyddat Word-dokument till JSON i Python.

  • Ladda Word-dokumentet med Document-klassen Aspose.Words.
  • Använd LoadOptions-klassen Aspose.Words för att ange lösenordet för ett skyddat Word-dokument.
  • Spara Word-dokument som HTML med metoden Document.save().
  • Ladda HTML-fil med Workbook-klassen Aspose.Cells.
  • Konvertera dokument till JSON-format med metoden Workbook.save().

Följande kodexempel visar hur man konverterar ett skyddat Word-dokument till JSON i Python.

# Ladda skyddade dokument med LoadOptions
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# Spara dokument i HTML-format
doc.save("html_output.html", aw.SaveFormat.HTML)

# Ladda HTML-filen i en instans av Workbook-klassen
book = Workbook("html_output.html")

# Spara som JSON
book.save("word-to-json.json", SaveFormat.JSON)

Python Word to JSON Converter Libraries - Skaffa en gratis licens

Du kan få en gratis tillfällig licens för att använda biblioteken utan utvärderingsbegränsningar.

Slutsats

I den här artikeln har du lärt dig hur du konverterar Word till JSON i Python. Dessutom har du sett hur man konverterar ett lösenordsskyddat Word-dokument till JSON programmatiskt. Dessutom kan du besöka dokumentationen för Aspose.Words for Python och Aspose.Cells for Python för att utforska mer om biblioteken. Om du har några frågor är du välkommen att meddela oss via vårt forum.

Se även