Il formato HTML è popolare perché è supportato su quasi tutti gli ambienti di computer. La conversione da WORD a HTML o MHTML è utile in scenari come quando è necessario visualizzare un file di questo tipo in un’applicazione Web utilizzando C++. Aspose.Words per l’API C++ è la scelta migliore per le sue caratteristiche e l’efficienza. Puoi arricchire le tue applicazioni C++ con la possibilità di convertire file Microsoft Word (DOC/DOCX) in formato HTML o MHTML. Di seguito è riportato uno schema di questo articolo in cui esploreremo in dettaglio la conversione di Word:

API C++ per il convertitore di file di Microsoft Word – Installazione

È necessario installare l’API Aspose.Words per C++ per convertire i file di Microsoft Word (DOCX/DOC). Puoi installare facilmente l’API dalla galleria NuGet o installarla con il comando seguente sulla console.

Install-Package Aspose.Words.Cpp -Version 20.8.0

Converti Word (DOCX/DOC) in HTML usando C++

La conversione da Word a HTML è utile quando si desidera eseguire il rendering dei contenuti per visualizzarli in un browser. Le tue applicazioni C++ possono eseguire rapidamente la conversione con i seguenti passaggi:

  1. Carica il file di parole di origine
  2. Salva il documento in formato HTML

Il codice seguente mostra come convertire una parola in HTML usando C++:

// Carica il documento da
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Salva il documento word in formato HTML
doc->Save(u"Document_out.html", SaveFormat::Html);

Converti Word in HTML con i caratteri incorporati usando C++

Un file word (DOCX/DOC) può contenere alcuni font personalizzati che potrebbero non essere supportati su alcune piattaforme. In questi casi, il carattere potrebbe apparire confuso nei risultati di output. Tuttavia, l’API Aspose.Words per C++ consente di incorporare le risorse dei caratteri in HTML utilizzando la codifica Base64. È possibile impostare la proprietà ExportFontsAsBase64 che incorporerà i caratteri nel file HTML di output. È necessario seguire i passaggi seguenti per raggiungere questi requisiti:

  1. Carica il file DOCX di origine
  2. Imposta la proprietà ExportFontsAsBase64.
  3. Salva il file HTML di output

Il seguente frammento di codice mostra come convertire Word in HTML con i caratteri incorporati utilizzando C++:

// Carica il file DOCX di origine
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// Inizializza l'oggetto HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// Salva l'HTML di output
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Inoltre, se modifichi il file HTML con Blocco note o visualizzi il codice sorgente in un browser, puoi notare i caratteri Base64 incorporati nel file. La schermata seguente mostra un esempio dal file HTML di output:

Converti Word in HTML

Converti Word in HTML con informazioni di andata e ritorno in C++

I documenti di Microsoft Word possono contenere molte informazioni e funzionalità che altrimenti non sarebbero supportate nel formato file HTML. A volte è necessario convertire Word in HTML e poi di nuovo in formato Word. Per garantire la massima fedeltà tra queste conversioni, alcune informazioni, note come “informazioni di andata e ritorno” possono essere salvate in aggiunta da Aspose.Words per l’API C++. Seguiamo i seguenti passaggi per testare tale conversione:

  1. Carica il file DOCX di origine
  2. Imposta ExportRoundtripInformation su true
  3. Salva il file HTML di output

Il frammento di codice seguente mostra come convertire Word in HTML con informazioni di andata e ritorno utilizzando C++:

// Carica il file DOCX di input
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// Imposta HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Salva il file HTML di output        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Converti Word in MHTML in C++

Il formato di file MHTML è popolare in quanto contiene tutti i contenuti all’interno di un unico file di output. Puoi convertire file Word (DOCX/DOC) in formato MHTML utilizzando C++ con i seguenti passaggi:

  1. Carica il file DOCX di origine
  2. Salva l’output in formato MHTML

Il frammento di codice seguente mostra come convertire Word in MHTML usando C++:

// Carica il documento in Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Salva l'output in formato MHTML.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

Conclusione

Abbiamo imparato a convertire Word (DOCX/DOC) in HTML o MHTML con diverse opzioni. Vengono discusse in dettaglio anche diverse funzionalità come il salvataggio di informazioni di andata e ritorno o l’incorporamento di caratteri come risorse Base64. Tuttavia, in caso di domande, non esitare a contattarci tramite il Forum di supporto gratuito.

Guarda anche