Convertir Word DOC DOCX en HTML MHTML

Cet article explique comment convertir des documents Word DOC DOCX en HTML ou MHTML à l’aide de C# ou VB.NET. L’API Aspose.Words for .NET peut être utilisée pour effectuer cette conversion assez facilement. La conversion de documents Microsoft Word est un cas d’utilisation populaire, donc différentes options sont prises en charge par l’API. Vous pouvez jeter un œil aux titres qui sont couverts dans cet article :

API de conversion C# Word vers HTML ou MHTML

L’API Aspose.Words for .NET est spécialement conçue pour fonctionner avec les formats de fichiers pris en charge par Microsoft Word. Vous pouvez convertir un fichier DOCX ou DOC au format de fichier HTML ou MHTML en téléchargeant l’API à partir de la section New Releases ou en l’installant à partir de NuGet à l’aide de la commande ci-dessous :

Install-Package Aspose.Words -Version 20.9.0

Convertir Word DOC ou DOCX en HTML en C#

Vous pouvez convertir efficacement un document Word (DOC/DOCX) en une page Web HTML par programme dans les applications .NET à l’aide de C# ou VB.NET. Vous devez suivre les étapes ci-dessous pour la conversion :

  1. Charger le document Word DOCX d’entrée
  2. Initialiser une instance de HtmlSaveOptions
  3. Enregistrez le fichier HTML de sortie

L’extrait de code suivant suit ces étapes et montre comment convertir DOC/DOCX en HTML à l’aide de C# ou VB.NET :

// Chargez le document à partir du disque.
Document doc = new Document(dataDir + "Test File.docx");

// Définir HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// Enregistrez le document en HTML
doc.Save(dataDir + "Document.html", options);

Convertir Word DOC ou DOCX en HTML avec des informations aller-retour en C#

Certaines informations supplémentaires sont enregistrées lors de la conversion de Word en HTML. Il est connu sous le nom d’informations aller-retour et est utile pour les scénarios où le fichier HTML converti est à nouveau rendu sous forme de document Word. Vous pouvez suivre ces étapes pour convertir DOC/DOCX en HTML en utilisant C# :

  1. Charger le document Word d’entrée
  2. Définissez ExportRoundtripInformation sur vrai
  3. Enregistrez le fichier HTML de sortie

L’extrait de code ci-dessous explique comment convertir un fichier Word DOC/DOCX en HTML avec des informations aller-retour à l’aide de C# ou VB.NET :

// Chargez le document à partir du disque.
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// La propriété HtmlSaveOptions.ExportRoundtripInformation spécifie
// S'il faut écrire les informations d'aller-retour lors de l'enregistrement au format HTML, MHTML ou EPUB.
// La valeur par défaut est true pour HTML et false pour MHTML et EPUB.
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

Convertir Word DOC ou DOCX en MHTML en C#

Le format de fichier MHTML mérite d’être mentionné lorsque vous avez besoin d’un seul fichier HTML avec des images et des polices intégrées. Vous pouvez convertir un document Word (DOC/DOCX) en MHTML en suivant les étapes ci-dessous :

  1. Charger le fichier DOC/DOCX source
  2. Définissez SaveFormat sur MHTML

L’extrait de code ci-dessous montre comment convertir un document Word (DOC/DOCX) en MHML en utilisant C# ou VB.NET :

// Chargez le document à partir du disque.
Document doc = new Document(dataDir + "Test File.docx");

// Définir HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// Enregistrez le document en MHTML
doc.Save(dataDir + "Document.mhtml", options);

Conclusion

Dans cet article, nous avons expliqué comment convertir des documents Word en fichiers HTML ou MHTML en C# sans avoir à installer l’application Microsoft Word. De plus, vous avez appris avec des exemples et des étapes détaillées pour effectuer les appels d’API pour exporter des documents Word vers les formats de fichiers requis. De plus, vous pouvez consulter les références API et la Documentation. De plus, vous pouvez nous écrire et poser des questions sur Free Support Forum.

Voir également