Dans divers cas, vous devez afficher le contenu des fichiers Word DOCX dans vos applications Web ou de bureau. L’une des options appropriées dans de tels cas est la conversion de DOCX en HTML. Pour y parvenir à partir des applications .NET, cet article explique comment convertir des fichiers DOCX en HTML en C#. De plus, vous apprendrez à contrôler dynamiquement la conversion DOCX en HTML à l’aide de différentes options.
- API C# pour la conversion DOCX en HTML
- Convertir un DOCX en HTML en C#
- Personnaliser la conversion DOCX en HTML
API de conversion C# DOCX en HTML - Téléchargement gratuit
Pour effectuer la conversion DOCX vers HTML à partir des applications .NET, nous utiliserons Aspose.Words for .NET. C’est une puissante bibliothèque de classes qui vous permet de créer et de manipuler des documents Word. En outre, il vous permet de convertir des documents DOCX en divers autres formats de fichiers. Vous pouvez soit télécharger l’API ou l’installer à l’aide de NuGet.
PM> Install-Package Aspose.Words
Convertir DOCX en HTML en C#
Aspose.Words for .NET vous permet de convertir plus facilement un document DOCX en HTML. Chargez simplement le document DOCX et enregistrez-le en tant que fichier HTML. Voici les étapes pour convertir un fichier DOCX en HTML en C#.
- Chargez le document DOCX à l’aide de la classe Document.
- Convertissez le document DOCX en HTML à l’aide de la méthode Document.Save(string, SaveFormat).
L’exemple de code suivant montre comment convertir un DOCX en HTML à l’aide de C#.
// Charger le document à partir du disque
Document doc = new Document("Document.docx");
// Enregistrez le document au format HTML
doc.Save("Document.html", SaveFormat.Html);
C# Personnaliser la conversion DOCX en HTML
Aspose.Words for .NET vous permet également de personnaliser la conversion DOCX en HTML à l’aide de différentes options. Par exemple, vous pouvez spécifier un dossier pour conserver séparément les fichiers de ressources (CSS, polices et image). De plus, vous pouvez exporter les informations aller-retour du document. Les sections suivantes montrent comment utiliser ces options.
C# DOCX vers HTML - Exporter les informations aller-retour
MS Word fournit un large éventail de fonctionnalités et toutes ne sont pas prises en charge par HTML. Par conséquent, pour rendre le contenu HTML proche du document d’origine, des informations aller-retour sont utilisées. Les étapes suivantes montrent comment exporter des informations aller-retour dans la conversion DOCX vers HTML en C#.
- Chargez le document DOCX à l’aide de la classe Document.
- Créez un objet de la classe HtmlSaveOptions.
- Activez l’exportation des informations d’aller-retour à l’aide de la propriété HtmlSaveOptions.ExportRoundtripInformation.
- Convertissez le document DOCX en HTML à l’aide de la méthode Document.Save(string, HtmlSaveOptions).
L’exemple de code suivant montre comment exporter des informations aller-retour dans la conversion DOCX vers HTML dans C# .NET.
// Charger le document à partir du disque
Document doc = new Document("Document.docx");
// Activer les informations aller-retour
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;
// Enregistrer au format HTML
doc.Save("ExportRoundtripInformation_out.html", options);
Conversion C# DOCX en HTML - Spécifier le dossier de ressources
Lors de la conversion de DOCX en HTML, vous pouvez enregistrer les fichiers de ressources dans un dossier séparé. Vous pouvez également spécifier des dossiers pour conserver les polices et les images séparément. Voici les étapes pour y parvenir.
- Chargez le document DOCX à l’aide de la classe Document.
- Créez un objet de la classe HtmlSaveOptions.
- Définissez le dossier de ressources à l’aide de la propriété HtmlSaveOptions.ResourceFolder.
- Convertissez le document DOCX en HTML à l’aide de la méthode Document.Save(string, HtmlSaveOptions).
L’exemple de code suivant montre comment conserver les ressources dans un dossier séparé lors de la conversion C# DOCX vers HTML.
// Charger le document
Document doc = new Document("document.docx");
// Définir le dossier pour les ressources
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";
// Convertir un document en HTML
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);
En savoir plus sur l’utilisation des dossiers de ressources dans la conversion DOCX vers HTML.
API C# pour la conversion DOCX en HTML - Obtenez une licence gratuite
Vous pouvez obtenir une licence temporaire afin d’utiliser Aspose.Words for .NET sans limitations d’évaluation.
Conclusion
Dans cet article, vous avez appris à convertir des fichiers DOCX en HTML en C#. De plus, vous avez vu comment utiliser différentes options pour personnaliser la conversion DOCX en HTML. Vous pouvez également explorer d’autres fonctionnalités d’Aspose.Words for .NET à l’aide de la documentation. De plus, vous pouvez poster vos questions sur notre forum.