Word vers HTML C#

Dans divers cas, vous devez afficher le contenu des documents Word dans vos applications Web ou de bureau. L’une des options appropriées dans de tels cas est la conversion des documents Word en HTML. Pour y parvenir à partir des applications .NET, cet article explique comment convertir des fichiers Word DOCX ou DOC en HTML à l’aide de C#. De plus, vous apprendrez à contrôler dynamiquement la conversion de Word en HTML à l’aide de différentes options.

API C# pour la conversion de Word en HTML

Pour effectuer la conversion de Word en HTML à partir des applications .NET, nous utiliserons Aspose.Words for .NET. C’est une puissante bibliothèque de classes qui vous permet de créer et de manipuler des documents Word. En outre, il vous permet de convertir des documents Word en divers autres formats de fichiers. Vous pouvez soit télécharger l’API ou l’installer à l’aide de NuGet.

PM> Install-Package Aspose.Words 

Convertir un document Word en HTML en C#

Aspose.Words for .NET vous permet de convertir plus facilement un document Word en HTML. Chargez simplement le document Word et enregistrez-le en tant que fichier HTML. Voici les étapes pour convertir un fichier Word DOCX en HTML en C#.

L’exemple de code suivant montre comment convertir un document Word en HTML à l’aide de C#.

// Charger le document à partir du disque
Document doc = new Document("Document.docx");

// Enregistrez le document au format HTML
doc.Save("Document.html", SaveFormat.Html);

Personnaliser la conversion de Word en HTML en C#

Aspose.Words for .NET vous permet également de personnaliser la conversion de Word en HTML à l’aide de différentes options. Par exemple, vous pouvez spécifier un dossier pour conserver séparément les fichiers de ressources (CSS, polices et image). De plus, vous pouvez exporter les informations aller-retour du document. Les sections suivantes montrent comment utiliser ces options.

Exporter les informations aller-retour dans la conversion Word vers HTML

MS Word fournit un large éventail de fonctionnalités et toutes ne sont pas prises en charge par HTML. Par conséquent, pour rendre le contenu HTML proche du document d’origine, des informations aller-retour sont utilisées. Les étapes suivantes montrent comment exporter des informations aller-retour dans la conversion Word vers HTML.

L’exemple de code suivant montre comment exporter des informations aller-retour dans la conversion Word vers HTML.

// Charger le document à partir du disque
Document doc = new Document("Document.docx");

// Activer les informations aller-retour
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;

// Enregistrer au format HTML
doc.Save("ExportRoundtripInformation_out.html", options);

Spécifier le dossier de ressources dans la conversion Word en HTML

Lors de la conversion de Word en HTML, vous pouvez enregistrer les fichiers de ressources dans un dossier séparé. Vous pouvez également spécifier des dossiers pour conserver les polices et les images séparément. Voici les étapes pour y parvenir.

L’exemple de code suivant montre comment conserver les ressources dans un dossier séparé lors de la conversion Word vers HTML.

// Charger le document 
Document doc = new Document("document.docx");

// Définir le dossier pour les ressources
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";

// Convertir un document en HTML
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);

En savoir plus sur l’utilisation des dossiers de ressources dans la conversion Word vers HTML.

Obtenez une licence API gratuite

Vous pouvez obtenir une licence temporaire afin d’utiliser Aspose.Words for .NET sans limitations d’évaluation.

Conclusion

Dans cet article, vous avez appris à convertir des documents Word DOCX ou DOC en HTML à l’aide de C#. De plus, vous avez vu comment utiliser différentes options pour personnaliser la conversion de Word en HTML. Vous pouvez également explorer d’autres fonctionnalités d’Aspose.Words for .NET à l’aide de la documentation. De plus, vous pouvez poster vos questions sur notre forum.

Voir également