Word in HTML Python

La conversione da Word a HTML è richiesta in vari casi, ad esempio per incorporare il contenuto del documento nelle pagine web. In questo articolo imparerai come convertire i documenti MS Word DOCX o DOC in HTML usando Python. Inoltre, imparerai come controllare la conversione di Word in HTML in modo dinamico utilizzando diverse opzioni.

API di conversione da Python a HTML

Per convertire i documenti Word in HTML, useremo Aspose.Words for Python. È un’API potente e ricca di funzionalità per la creazione e la manipolazione di documenti Word. Inoltre, fornisce una conversione ad alta fedeltà di documenti Word in altri formati. Aspose.Words per Python è disponibile su PyPI e puoi installarlo usando il comando pip seguente.

pip install aspose-words 

Converti un documento Word in HTML in Python

Di seguito sono riportati i passaggi per convertire un documento Word in un file HTML utilizzando Python.

  • Carica il documento di Word usando la classe Document.
  • Crea un oggetto della classe HtmlSaveOptions.
  • Abilita l’esportazione delle risorse dei caratteri utilizzando la proprietà HtmlSaveOptions.exportfontresources.
  • Converti il documento Word in HTML usando il metodo Document.save().

L’esempio di codice seguente mostra come convertire un file DOCX in HTML in Python.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Enable export of fonts
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
  
# Save the document as HTML
doc.save("Document.html", options)

Personalizza la conversione da Word a HTML in Python

Aspose.Words per Python fornisce anche diverse opzioni per personalizzare la conversione da Word a HTML. Ad esempio, puoi convertire documenti con informazioni di andata e ritorno, specificare la cartella in cui salvare i file di risorse e così via.

Converti un documento Word con informazioni di andata e ritorno

L’HTML non supporta tutte le funzionalità fornite da MS Word, quindi, per imitare il documento Word in HTML, è necessario salvare informazioni aggiuntive definite informazioni di andata e ritorno. Di seguito sono riportati i passaggi per attivare l’esportazione delle informazioni di andata e ritorno nella conversione di Word in HTML.

  • Carica il documento di Word usando la classe Document.
  • Crea un oggetto della classe HtmlSaveOptions e imposta la proprietà HtmlSaveOptions.exportroundtripinformation su true.
  • Converti il documento Word in HTML usando il metodo Document.save() e passa il nome del file HTML e HtmlSaveOptions come parametri.

Nell’esempio di codice seguente viene illustrato come esportare le informazioni di andata e ritorno nella conversione di Word in HTML.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Enable round-trip information
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True 

# Save the document as HTML
doc.save("Document.html", saveOptions)

Da Word a HTML: specificare una cartella per le risorse

Puoi anche specificare una cartella in cui memorizzare tutte le risorse come immagini, file CSS e caratteri. Per questo, puoi usare la proprietà HtmlSaveOptions.exportfontresources. È inoltre possibile specificare cartelle separate per caratteri e immagini utilizzando rispettivamente le proprietà HtmlSaveOptions.fontsfolder e HtmlSaveOptions.imagesfolder. Di seguito sono riportati i passaggi per utilizzare una cartella separata per salvare le risorse nella conversione da Word a HTML.

  • Carica il documento di Word usando la classe Document.
  • Crea un oggetto della classe HtmlSaveOptions e imposta la proprietà HtmlSaveOptions.exportfontresources su true.
  • Specificare il nome della cartella delle risorse utilizzando la proprietà HtmlSaveOptions.resourcefolder.
  • Converti il documento Word in HTML usando il metodo Document.save() e passa il nome del file HTML e HtmlSaveOptions come parametri.

Nell’esempio di codice seguente viene illustrato come specificare una cartella di risorse nella conversione da Word a HTML.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Specify resource folder
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"

# Save the document as HTML
doc.save("Document.html", saveOptions)

Ottieni una licenza API gratuita

Puoi ottenere una licenza temporanea per utilizzare Aspose.Words per Python senza limitazioni di valutazione.

Conclusione

In questo articolo, hai imparato come convertire documenti Word in HTML usando Python. Inoltre, hai visto come personalizzare dinamicamente la conversione da Word a HTML. Inoltre, puoi esplorare altre funzionalità di Aspose.Words per Python usando la documentazione. Inoltre, puoi porre le tue domande tramite il nostro forum.

Guarda anche

Informazioni: potresti essere interessato a un’altra API Python (Aspose.Slides for Python via NET) che ti consente di convertire presentazioni in immagini e importare immagini in presentazioni.