Le format HTML est populaire car il est pris en charge sur presque tous les environnements informatiques. La conversion WORD en HTML ou MHTML est utile dans des scénarios tels que lorsque vous devez afficher un tel fichier dans une application Web utilisant C++. L’API Aspose.Words for C++ est le meilleur choix en raison de ses fonctionnalités et de son efficacité. Vous pouvez enrichir vos applications C++ avec la possibilité de convertir des fichiers Microsoft Word (DOC/DOCX) au format HTML ou MHTML. Voici un aperçu de cet article où nous explorerons en détail la conversion de Word :

API de conversion de fichiers C++ Microsoft Word – Installation

Nous devons installer Aspose.Words for C++ pour convertir les fichiers Microsoft Word (DOCX/DOC). Vous pouvez facilement installer l’API à partir de la galerie NuGet ou l’installer avec la commande suivante sur la console.

Install-Package Aspose.Words.Cpp -Version 20.8.0

Convertir Word (DOCX/DOC) en HTML en utilisant C++

La conversion Word en HTML est utile lorsque vous souhaitez afficher du contenu afin de l’afficher dans un navigateur. Vos applications C++ peuvent rapidement effectuer la conversion en procédant comme suit :

  1. Charger le fichier Word source
  2. Enregistrez le document au format HTML

Le code ci-dessous montre comment convertir Word en HTML en utilisant C++ :

// Chargez le document à partir de
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Enregistrez le document Word au format HTML
doc->Save(u"Document_out.html", SaveFormat::Html);

Convertir Word en HTML avec des polices intégrées à l’aide de C++

Un fichier Word (DOCX/DOC) peut contenir une police personnalisée qui peut ne pas être prise en charge sur certaines plates-formes. Dans de tels cas, la police peut apparaître brouillée dans les résultats de sortie. Cependant, l’API Aspose.Words for C++ vous permet d’intégrer les ressources de police dans HTML à l’aide de l’encodage Base64. Vous pouvez définir la propriété ExportFontsAsBase64 qui intégrera les polices dans le fichier HTML de sortie. Vous devez suivre les étapes ci-dessous pour atteindre ces exigences :

  1. Charger le fichier DOCX source
  2. Définir la propriété ExportFontsAsBase64
  3. Enregistrez le fichier HTML de sortie

L’extrait de code suivant montre comment convertir Word en HTML avec des polices intégrées à l’aide de C++ :

// Charger le fichier DOCX source
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// Initialiser l'objet HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// Enregistrer la sortie HTML
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

De plus, si vous modifiez le fichier HTML avec le Bloc-notes ou voyez le code source dans un navigateur, vous pouvez remarquer les polices Base64 intégrées dans le fichier. La capture d’écran suivante montre un exemple du fichier HTML de sortie :

Convertir Word en HTML

Convertir Word en HTML avec des informations aller-retour en C++

Les documents Microsoft Word peuvent contenir de nombreuses informations et fonctionnalités qui ne sont pas prises en charge par le format de fichier HTML. Parfois, vous devez convertir Word en HTML, puis revenir au format Word. Pour garantir une fidélité maximale entre ces conversions, certaines informations, appelées “informations aller-retour”, peuvent être enregistrées en plus par Aspose.Words for C++. Suivons les étapes suivantes pour tester une telle conversion :

  1. Charger le fichier DOCX source
  2. Définissez ExportRoundtripInformation sur vrai
  3. Enregistrez le fichier HTML de sortie

L’extrait de code ci-dessous montre comment convertir Word en HTML avec des informations aller-retour à l’aide de C++ :

// Charger le fichier DOCX d'entrée
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// Définir HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Enregistrer le fichier HTML de sortie        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Convertir Word en MHTML en C++

Le format de fichier MHTML est populaire car il contient tout le contenu dans un seul fichier de sortie. Vous pouvez convertir un fichier Word (DOCX/DOC) au format MHTML en utilisant C++ en suivant les étapes suivantes :

  1. Charger le fichier DOCX source
  2. Enregistrer la sortie au format MHTML

L’extrait de code ci-dessous montre comment convertir Word en MHTML à l’aide de C++ :

// Chargez le document dans Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Enregistrez la sortie au format MHTML.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

Conclusion

Nous avons appris à convertir Word (DOCX/DOC) en HTML ou MHTML avec différentes options. Plusieurs fonctionnalités telles que la sauvegarde des informations d’aller-retour ou l’intégration de polices en tant que ressources Base64 sont également décrites en détail. Cependant, en cas de questions, n’hésitez pas à nous contacter via Forum d’assistance gratuit.

Voir également