En varios casos, debe mostrar el contenido de los archivos DOCX de Word en sus aplicaciones web o de escritorio. Una de las opciones adecuadas en estos casos es la conversión de DOCX a HTML. Para lograr esto desde las aplicaciones .NET, este artículo cubre cómo convertir archivos DOCX a HTML en C#. Además, aprenderá cómo controlar la conversión de DOCX a HTML de forma dinámica utilizando diferentes opciones.
- API de C# para la conversión de DOCX a HTML
- Convertir un DOCX a HTML en C#
- Personalice la conversión de DOCX a HTML
API de conversión de C# DOCX a HTML - Descarga gratuita
Para realizar la conversión de DOCX a HTML desde las aplicaciones .NET, usaremos Aspose.Words for .NET. Es una poderosa biblioteca de clases que le permite crear y manipular documentos de Word. Además, le permite convertir documentos DOCX a otros formatos de archivo. Puede descargar la API o instalarla usando NuGet.
PM> Install-Package Aspose.Words
Convertir DOCX a HTML en C#
Aspose.Words for .NET hace que sea mucho más fácil para usted convertir un documento DOCX a HTML. Simplemente cargue el documento DOCX y guárdelo como un archivo HTML. Los siguientes son los pasos para convertir un archivo DOCX a HTML en C#.
- Cargue el documento DOCX usando la clase Document.
- Convierta un documento DOCX a HTML usando el método Document.Save(string, SaveFormat).
El siguiente ejemplo de código muestra cómo convertir un DOCX a HTML usando C#.
// Cargue el documento desde el disco
Document doc = new Document("Document.docx");
// Guardar el documento como HTML
doc.Save("Document.html", SaveFormat.Html);
C# Personaliza la conversión de DOCX a HTML
Aspose.Words for .NET también le permite personalizar la conversión de DOCX a HTML usando diferentes opciones. Por ejemplo, puede especificar una carpeta para mantener los archivos de recursos (CSS, fuentes e imagen) por separado. Además, puede exportar información de ida y vuelta del documento. Las siguientes secciones muestran cómo usar estas opciones.
C# DOCX a HTML - Exportar información de ida y vuelta
MS Word proporciona una amplia gama de funciones y no todas son compatibles con HTML. Por lo tanto, para que el contenido de HTML se acerque al documento original, se utiliza información de ida y vuelta. Los siguientes pasos muestran cómo exportar información de ida y vuelta en DOCX a conversión HTML en C#.
- Cargue el documento DOCX usando la clase Document.
- Cree un objeto de la clase HtmlSaveOptions.
- Habilite la exportación de información de ida y vuelta mediante la propiedad HtmlSaveOptions.ExportRoundtripInformation.
- Convierta un documento DOCX a HTML usando el método Document.Save(string, HtmlSaveOptions).
El siguiente ejemplo de código muestra cómo exportar información de ida y vuelta en DOCX a conversión HTML en C# .NET.
// Cargue el documento desde el disco
Document doc = new Document("Document.docx");
// Habilitar información de ida y vuelta
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;
// Guardar como HTML
doc.Save("ExportRoundtripInformation_out.html", options);
Conversión de C# DOCX a HTML - Especificar carpeta de recursos
Mientras realiza la conversión de DOCX a HTML, puede guardar los archivos de recursos en una carpeta separada. Además, puede especificar carpetas para mantener fuentes e imágenes por separado. Los siguientes son los pasos para lograrlo.
- Cargue el documento DOCX usando la clase Document.
- Cree un objeto de la clase HtmlSaveOptions.
- Configure la carpeta de recursos usando la propiedad HtmlSaveOptions.ResourceFolder.
- Convierta un documento DOCX a HTML usando el método Document.Save(string, HtmlSaveOptions).
El siguiente ejemplo de código muestra cómo mantener los recursos en una carpeta separada en la conversión de C# DOCX a HTML.
// Cargar documento
Document doc = new Document("document.docx");
// Establecer carpeta para recursos
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";
// Convertir documento a HTML
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);
Leer más sobre cómo trabajar con carpetas de recursos en la conversión de DOCX a HTML.
API de C# para la conversión de DOCX a HTML: obtenga una licencia gratuita
Puede obtener una licencia temporal para usar Aspose.Words for .NET sin limitaciones de evaluación.
Conclusión
En este artículo, ha aprendido a convertir archivos DOCX a HTML en C#. Además, ha visto cómo usar diferentes opciones para personalizar la conversión de DOCX a HTML. También puede explorar otras características de Aspose.Words for .NET utilizando la documentación. Además, puede publicar sus consultas en nuestro foro.