In vari casi, è necessario visualizzare il contenuto dei file Word DOCX nelle applicazioni Web o desktop. Una delle opzioni adatte in questi casi è la conversione di DOCX in HTML. Per ottenere ciò dall’interno delle applicazioni .NET, questo articolo illustra come convertire i file DOCX in HTML in C#. Inoltre, imparerai come controllare la conversione da DOCX a HTML in modo dinamico utilizzando diverse opzioni.
- API C# per la conversione da DOCX a HTML
- Converti un DOCX in HTML in C#
- Personalizza la conversione da DOCX a HTML
API di conversione da C# DOCX a HTML - Download gratuito
Per eseguire la conversione da DOCX a HTML dall’interno delle applicazioni .NET, utilizzeremo Aspose.Words for .NET. È una potente libreria di classi che ti consente di creare e manipolare documenti di Word. Inoltre, ti consente di convertire documenti DOCX in vari altri formati di file. Puoi scaricare l’API o installarla utilizzando NuGet.
PM> Install-Package Aspose.Words
Converti DOCX in HTML in C#
Aspose.Words per .NET semplifica la conversione di un documento DOCX in HTML. Basta caricare il documento DOCX e salvarlo come file HTML. Di seguito sono riportati i passaggi per convertire un file DOCX in HTML in C#.
- Carica il documento DOCX usando la classe Document.
- Converti il documento DOCX in HTML usando il metodo Document.Save(string, SaveFormat).
L’esempio di codice seguente mostra come convertire un DOCX in HTML usando C#.
// Carica il documento dal disco
Document doc = new Document("Document.docx");
// Salva il documento come HTML
doc.Save("Document.html", SaveFormat.Html);
C# Personalizza la conversione da DOCX a HTML
Aspose.Words per .NET consente inoltre di personalizzare la conversione da DOCX a HTML utilizzando diverse opzioni. Ad esempio, puoi specificare una cartella in cui conservare i file di risorse (CSS, font e immagine) separatamente. Inoltre, puoi esportare le informazioni di andata e ritorno del documento. Le sezioni seguenti illustrano come utilizzare queste opzioni.
C# DOCX in HTML - Esporta informazioni di andata e ritorno
MS Word offre un’ampia gamma di funzionalità e non tutte sono supportate da HTML. Pertanto, per rendere il contenuto dell’HTML vicino al documento originale, vengono utilizzate le informazioni di andata e ritorno. I passaggi seguenti mostrano come esportare le informazioni di andata e ritorno in DOCX in conversione HTML in C#.
- Carica il documento DOCX usando la classe Document.
- Crea un oggetto della classe HtmlSaveOptions.
- Abilita l’esportazione delle informazioni di andata e ritorno usando la proprietà HtmlSaveOptions.ExportRoundtripInformation.
- Converti il documento DOCX in HTML usando il metodo Document.Save(string, HtmlSaveOptions).
Nell’esempio di codice seguente viene illustrato come esportare le informazioni di andata e ritorno in DOCX nella conversione HTML in C# .NET.
// Carica il documento dal disco
Document doc = new Document("Document.docx");
// Abilita le informazioni di andata e ritorno
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;
// Salva come HTML
doc.Save("ExportRoundtripInformation_out.html", options);
Conversione da C# DOCX a HTML - Specificare la cartella delle risorse
Durante l’esecuzione della conversione da DOCX a HTML, è possibile salvare i file di risorse in una cartella separata. Inoltre, puoi specificare le cartelle per mantenere i caratteri e le immagini separatamente. Di seguito sono riportati i passaggi per raggiungere questo obiettivo.
- Carica il documento DOCX usando la classe Document.
- Crea un oggetto della classe HtmlSaveOptions.
- Imposta la cartella delle risorse usando la proprietà HtmlSaveOptions.ResourceFolder.
- Converti il documento DOCX in HTML usando il metodo Document.Save(string, HtmlSaveOptions).
Nell’esempio di codice seguente viene illustrato come mantenere le risorse in una cartella separata nella conversione da C# DOCX a HTML.
// Carica documento
Document doc = new Document("document.docx");
// Imposta cartella per le risorse
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";
// Converti documento in HTML
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);
Leggi di più sull’utilizzo delle cartelle di risorse nella conversione da DOCX a HTML.
API C# per la conversione da DOCX a HTML - Ottieni una licenza gratuita
Puoi ottenere una licenza temporanea per utilizzare Aspose.Words per .NET senza limitazioni di valutazione.
Conclusione
In questo articolo, hai imparato come convertire i file DOCX in HTML in C#. Inoltre, hai visto come utilizzare diverse opzioni per personalizzare la conversione da DOCX a HTML. Puoi anche esplorare altre funzionalità di Aspose.Words per .NET usando la documentazione. Inoltre, puoi pubblicare le tue domande sul nostro forum.