Converti Word in JSON in Python

In vari casi, è necessario eseguire la conversione da Word a JSON a livello di codice dall’applicazione Python. Ad esempio, per esportare i dati da un documento Word ed elaborarli o trasportarli in formato JSON. In questo articolo imparerai come convertire facilmente il testo in un documento Word in formato JSON. Inoltre, imparerai come caricare un documento Word protetto e convertirlo in JSON a livello di codice. Quindi procediamo con la conversione di Word in JSON in Python.

Come convertire Word in JSON in Python

Per convertire un documento Word in formato JSON, eseguiremo i seguenti passaggi:

  • Carica il documento di Word.
  • Convertilo in formato HTML.
  • Salva il file HTML in formato JSON.

Vediamo come implementare questi passaggi a livello di codice in Python. Per questo, installeremo prima un paio di librerie, come mostrato nella sezione seguente.

Librerie Python per convertire Word in JSON - Download gratuito

Aspose.Words for Python è una potente libreria progettata per creare ed elaborare documenti MS Word. Useremo questa libreria per esportare il contenuto di un documento Word in HTML. Una volta che avremo il contenuto HTML, useremo Aspose.Cells for Python per salvarlo come file JSON.

È possibile utilizzare i seguenti comandi pip per installare entrambe le librerie.

pip install aspose-cells
pip install aspose-words

Converti Word in JSON in Python

Di seguito sono riportati i passaggi per convertire Word in JSON in Python.

  • Carica il documento di Word usando la classe Document di Aspose.Words.
  • Salva il documento Word come HTML usando il metodo Document.save().
  • Carica il file HTML utilizzando la classe Workbook di Aspose.Cells.
  • Converti il documento in formato JSON usando il metodo Workbook.save().

L’esempio di codice seguente mostra come convertire un documento Word in JSON in Python.

# Carica documento
doc = aw.Document("document1.docx")

# Salva il documento in formato HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Carica il file HTML in un'istanza della classe Workbook
book = Workbook("html_output.html")

# Salva come JSON
book.save("word-to-json.json", SaveFormat.JSON)

Converti Word protetto in JSON in Python

Puoi anche caricare i documenti Word protetti utilizzando le loro password e convertirli in formato JSON. Di seguito sono riportati i passaggi per convertire un documento Word protetto in JSON in Python.

  • Carica il documento di Word usando la classe Document di Aspose.Words.
  • Utilizzare la classe LoadOptions di Aspose.Words per specificare la password del documento Word protetto.
  • Salva il documento Word come HTML usando il metodo Document.save().
  • Carica il file HTML utilizzando la classe Workbook di Aspose.Cells.
  • Converti il documento in formato JSON usando il metodo Workbook.save().

L’esempio di codice seguente mostra come convertire un documento Word protetto in JSON in Python.

# Carica il documento protetto utilizzando LoadOptions
doc = aw.Document("protected_doc.docx", aw.loading.LoadOptions("MyPassword"))

# Salva il documento in formato HTML
doc.save("html_output.html", aw.SaveFormat.HTML)

# Carica il file HTML in un'istanza della classe Workbook
book = Workbook("html_output.html")

# Salva come JSON
book.save("word-to-json.json", SaveFormat.JSON)

Librerie del convertitore da Python a JSON: ottieni una licenza gratuita

Puoi ottenere una licenza temporanea gratuita per utilizzare le librerie senza limitazioni di valutazione.

Conclusione

In questo articolo, hai imparato come convertire Word in JSON in Python. Inoltre, hai visto come convertire un documento Word protetto da password in JSON a livello di codice. Inoltre, puoi visitare la documentazione di Aspose.Words for Python e Aspose.Cells for Python per esplorare di più sulle librerie. In caso di domande, non esitare a farcelo sapere tramite il nostro forum.

Guarda anche