
Questo articolo illustra come convertire i documenti di Word DOC DOCX in HTML o MHTML utilizzando C# o VB.NET. L’API Aspose.Words for .NET può essere utilizzata per eseguire questa conversione abbastanza facilmente. La conversione di documenti Microsoft Word è un caso d’uso popolare, quindi l’API supporta diverse opzioni. Puoi dare un’occhiata ai titoli trattati in questo articolo:
- C# Word (DOC/DOCX) in HTML o API di conversione MHTML
- Converti Word DOC o DOCX in una pagina Web HTML in C#
- Word in HTML con informazioni di andata e ritorno in C#
- Converti Word DOC o DOCX in MHTML in C#
API di conversione da C# Word a HTML o MHTML
Aspose.Words per .NET API è appositamente progettato per funzionare con i formati di file supportati da Microsoft Word. Puoi convertire un file DOCX o DOC in formato file HTML o MHTML scaricando l’API dalla sezione Nuove versioni o installandola da NuGet utilizzando il comando seguente:
Install-Package Aspose.Words -Version 20.9.0
Converti Word DOC o DOCX in HTML in C#
È possibile convertire in modo efficiente un documento Word (DOC/DOCX) in una pagina Web HTML a livello di codice in applicazioni .NET utilizzando C# o VB.NET. È necessario seguire i passaggi seguenti per la conversione:
- Carica il documento word DOCX di input
- Inizializza un’istanza di HtmlSaveOptions
- Salva il file HTML di output
Il frammento di codice seguente segue questi passaggi e mostra come convertire DOC/DOCX in HTML usando C# o VB.NET:
// Carica il documento dal disco.
Document doc = new Document(dataDir + "Test File.docx");
// Imposta HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;
// Salva il documento in HTML
doc.Save(dataDir + "Document.html", options);
Converti Word DOC o DOCX in HTML con informazioni di andata e ritorno in C#
Alcune informazioni aggiuntive vengono salvate durante la conversione da Word a HTML. È noto come informazioni di andata e ritorno ed è utile per gli scenari in cui il file HTML convertito viene nuovamente visualizzato come documento Word. Puoi seguire questi passaggi per convertire DOC/DOCX in HTML usando C#:
- Carica il documento word di input
- Imposta ExportRoundtripInformation su true
- Salva il file HTML di output
Il frammento di codice seguente spiega come convertire il file Word DOC/DOCX in HTML con informazioni di andata e ritorno utilizzando C# o VB.NET:
// Carica il documento dal disco.
Document doc = new Document(dataDir + "Test File (doc).docx");
HtmlSaveOptions options = new HtmlSaveOptions();
// Specifica la proprietà HtmlSaveOptions.ExportRoundtripInformation
// Se scrivere le informazioni di andata e ritorno durante il salvataggio in HTML, MHTML o EPUB.
// Il valore predefinito è true per HTML e false per MHTML ed EPUB.
options.ExportRoundtripInformation = true;
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);
Converti Word DOC o DOCX in MHTML in C#
Vale la pena menzionare il formato di file MHTML quando è necessario un singolo file HTML con immagini e caratteri incorporati. Puoi convertire documenti Word (DOC/DOCX) in MHTML con i passaggi seguenti:
- Carica il file DOC/DOCX di origine
- Imposta SalvaFormato su MHTML
Il frammento di codice seguente mostra come convertire un documento Word (DOC/DOCX) in MHML usando C# o VB.NET:
// Carica il documento dal disco.
Document doc = new Document(dataDir + "Test File.docx");
// Imposta HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;
// Salva il documento in MHTML
doc.Save(dataDir + "Document.mhtml", options);
Conclusione
In questo articolo abbiamo spiegato come convertire documenti Word in file HTML o MHTML in C# senza dover installare l’applicazione Microsoft Word. Inoltre, hai imparato con esempi e passaggi dettagliati per effettuare chiamate API per esportare documenti Word nei formati di file richiesti. Inoltre, puoi dare un’occhiata a Riferimenti API e Documentazione. Inoltre, puoi scriverci e chiedere qualsiasi cosa su Forum di supporto gratuito.