Converti Word DOC DOCX in HTML MHTML

Questo articolo illustra come convertire i documenti di Word DOC DOCX in HTML o MHTML utilizzando C# o VB.NET. L’API Aspose.Words for .NET può essere utilizzata per eseguire questa conversione abbastanza facilmente. La conversione di documenti Microsoft Word è un caso d’uso popolare, quindi l’API supporta diverse opzioni. Puoi dare un’occhiata ai titoli trattati in questo articolo:

API di conversione da C# Word a HTML o MHTML

Aspose.Words per .NET API è appositamente progettato per funzionare con i formati di file supportati da Microsoft Word. Puoi convertire un file DOCX o DOC in formato file HTML o MHTML scaricando l’API dalla sezione Nuove versioni o installandola da NuGet utilizzando il comando seguente:

Install-Package Aspose.Words -Version 20.9.0

Converti Word DOC o DOCX in HTML in C#

È possibile convertire in modo efficiente un documento Word (DOC/DOCX) in una pagina Web HTML a livello di codice in applicazioni .NET utilizzando C# o VB.NET. È necessario seguire i passaggi seguenti per la conversione:

  1. Carica il documento word DOCX di input
  2. Inizializza un’istanza di HtmlSaveOptions
  3. Salva il file HTML di output

Il frammento di codice seguente segue questi passaggi e mostra come convertire DOC/DOCX in HTML usando C# o VB.NET:

// Carica il documento dal disco.
Document doc = new Document(dataDir + "Test File.docx");

// Imposta HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// Salva il documento in HTML
doc.Save(dataDir + "Document.html", options);

Converti Word DOC o DOCX in HTML con informazioni di andata e ritorno in C#

Alcune informazioni aggiuntive vengono salvate durante la conversione da Word a HTML. È noto come informazioni di andata e ritorno ed è utile per gli scenari in cui il file HTML convertito viene nuovamente visualizzato come documento Word. Puoi seguire questi passaggi per convertire DOC/DOCX in HTML usando C#:

  1. Carica il documento word di input
  2. Imposta ExportRoundtripInformation su true
  3. Salva il file HTML di output

Il frammento di codice seguente spiega come convertire il file Word DOC/DOCX in HTML con informazioni di andata e ritorno utilizzando C# o VB.NET:

// Carica il documento dal disco.
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// Specifica la proprietà HtmlSaveOptions.ExportRoundtripInformation
// Se scrivere le informazioni di andata e ritorno durante il salvataggio in HTML, MHTML o EPUB.
// Il valore predefinito è true per HTML e false per MHTML ed EPUB.
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

Converti Word DOC o DOCX in MHTML in C#

Vale la pena menzionare il formato di file MHTML quando è necessario un singolo file HTML con immagini e caratteri incorporati. Puoi convertire documenti Word (DOC/DOCX) in MHTML con i passaggi seguenti:

  1. Carica il file DOC/DOCX di origine
  2. Imposta SalvaFormato su MHTML

Il frammento di codice seguente mostra come convertire un documento Word (DOC/DOCX) in MHML usando C# o VB.NET:

// Carica il documento dal disco.
Document doc = new Document(dataDir + "Test File.docx");

// Imposta HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// Salva il documento in MHTML
doc.Save(dataDir + "Document.mhtml", options);

Conclusione

In questo articolo abbiamo spiegato come convertire documenti Word in file HTML o MHTML in C# senza dover installare l’applicazione Microsoft Word. Inoltre, hai imparato con esempi e passaggi dettagliati per effettuare chiamate API per esportare documenti Word nei formati di file richiesti. Inoltre, puoi dare un’occhiata a Riferimenti API e Documentazione. Inoltre, puoi scriverci e chiedere qualsiasi cosa su Forum di supporto gratuito.

Guarda anche