Palabra a HTML C#

En varios casos, debe mostrar el contenido de los archivos DOCX de Word en sus aplicaciones web o de escritorio. Una de las opciones adecuadas en estos casos es la conversión de DOCX a HTML. Para lograr esto desde las aplicaciones .NET, este artículo cubre cómo convertir archivos DOCX a HTML en C#. Además, aprenderá cómo controlar la conversión de DOCX a HTML de forma dinámica utilizando diferentes opciones.

API de conversión de C# DOCX a HTML - Descarga gratuita

Para realizar la conversión de DOCX a HTML desde las aplicaciones .NET, usaremos Aspose.Words for .NET. Es una poderosa biblioteca de clases que le permite crear y manipular documentos de Word. Además, le permite convertir documentos DOCX a otros formatos de archivo. Puede descargar la API o instalarla usando NuGet.

PM> Install-Package Aspose.Words 

Convertir DOCX a HTML en C#

Aspose.Words for .NET hace que sea mucho más fácil para usted convertir un documento DOCX a HTML. Simplemente cargue el documento DOCX y guárdelo como un archivo HTML. Los siguientes son los pasos para convertir un archivo DOCX a HTML en C#.

El siguiente ejemplo de código muestra cómo convertir un DOCX a HTML usando C#.

// Cargue el documento desde el disco
Document doc = new Document("Document.docx");

// Guardar el documento como HTML
doc.Save("Document.html", SaveFormat.Html);

C# Personaliza la conversión de DOCX a HTML

Aspose.Words for .NET también le permite personalizar la conversión de DOCX a HTML usando diferentes opciones. Por ejemplo, puede especificar una carpeta para mantener los archivos de recursos (CSS, fuentes e imagen) por separado. Además, puede exportar información de ida y vuelta del documento. Las siguientes secciones muestran cómo usar estas opciones.

C# DOCX a HTML - Exportar información de ida y vuelta

MS Word proporciona una amplia gama de funciones y no todas son compatibles con HTML. Por lo tanto, para que el contenido de HTML se acerque al documento original, se utiliza información de ida y vuelta. Los siguientes pasos muestran cómo exportar información de ida y vuelta en DOCX a conversión HTML en C#.

El siguiente ejemplo de código muestra cómo exportar información de ida y vuelta en DOCX a conversión HTML en C# .NET.

// Cargue el documento desde el disco
Document doc = new Document("Document.docx");

// Habilitar información de ida y vuelta
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;

// Guardar como HTML
doc.Save("ExportRoundtripInformation_out.html", options);

Conversión de C# DOCX a HTML - Especificar carpeta de recursos

Mientras realiza la conversión de DOCX a HTML, puede guardar los archivos de recursos en una carpeta separada. Además, puede especificar carpetas para mantener fuentes e imágenes por separado. Los siguientes son los pasos para lograrlo.

El siguiente ejemplo de código muestra cómo mantener los recursos en una carpeta separada en la conversión de C# DOCX a HTML.

// Cargar documento 
Document doc = new Document("document.docx");

// Establecer carpeta para recursos
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";

// Convertir documento a HTML
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);

Leer más sobre cómo trabajar con carpetas de recursos en la conversión de DOCX a HTML.

API de C# para la conversión de DOCX a HTML: obtenga una licencia gratuita

Puede obtener una licencia temporal para usar Aspose.Words for .NET sin limitaciones de evaluación.

Conclusión

En este artículo, ha aprendido a convertir archivos DOCX a HTML en C#. Además, ha visto cómo usar diferentes opciones para personalizar la conversión de DOCX a HTML. También puede explorar otras características de Aspose.Words for .NET utilizando la documentación. Además, puede publicar sus consultas en nuestro foro.

Ver también