El formato HTML es popular porque es compatible con casi todos los entornos informáticos. La conversión de WORD a HTML o MHTML es útil en escenarios como cuando necesita mostrar un archivo de este tipo en una aplicación web usando C++. Aspose.Words for C++ API es la mejor opción debido a sus características y eficiencia. Puede enriquecer sus aplicaciones C++ con la capacidad de convertir archivos de Microsoft Word (DOC/DOCX) a formato HTML o MHTML. A continuación se muestra un resumen de este artículo en el que exploraremos la conversión de Word en detalle:

C++ API de conversión de archivos de Microsoft Word: instalación

Necesitamos instalar Aspose.Words for C++ para convertir archivos de Microsoft Word (DOCX/DOC). Puede instalar fácilmente la API desde la galería NuGet o instalarla con el siguiente comando en la consola.

Install-Package Aspose.Words.Cpp -Version 20.8.0

Convierta Word (DOCX/DOC) a HTML usando C++

La conversión de Word a HTML es útil cuando desea representar contenido para mostrarlo en un navegador. Sus aplicaciones C++ pueden realizar rápidamente la conversión con los siguientes pasos:

  1. Cargar archivo de Word de origen
  2. Guarda el documento en formato HTML

El siguiente código muestra cómo convertir Word a HTML usando C++:

// Cargue el documento desde
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Guarde el documento de Word en formato HTML
doc->Save(u"Document_out.html", SaveFormat::Html);

Convierta Word a HTML con fuentes incrustadas usando C++

Un archivo de Word (DOCX/DOC) puede contener alguna fuente personalizada que podría no ser compatible con algunas plataformas. En tales casos, la fuente puede aparecer distorsionada en los resultados de salida. Sin embargo, Aspose.Words for C++ API le permite incrustar los recursos de fuente en HTML usando la codificación Base64. Puede establecer la propiedad ExportFontsAsBase64 que incrustará fuentes en el archivo HTML de salida. Debe seguir los pasos a continuación para lograr estos requisitos:

  1. Cargar archivo DOCX de origen
  2. Establezca la propiedad ExportFontsAsBase64
  3. Guarde el archivo HTML de salida

El siguiente fragmento de código muestra cómo convertir Word a HTML con fuentes incrustadas usando C++:

// Cargar archivo DOCX de origen
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// Inicializar el objeto HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// Guardar HTML de salida
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Además, si edita el archivo HTML con el Bloc de notas o ve el código fuente en un navegador, puede notar las fuentes Base64 incrustadas en el archivo. La siguiente captura de pantalla muestra un ejemplo del archivo HTML de salida:

Convertir Word a HTML

Convierta Word a HTML con información de ida y vuelta en C++

Los documentos de Microsoft Word pueden contener una gran cantidad de información y funciones que, de otro modo, no son compatibles con el formato de archivo HTML. A veces necesita convertir Word a HTML y luego volver al formato Word. Para garantizar la máxima fidelidad entre estas conversiones, Aspose.Words for C++ API puede guardar cierta información, conocida como “información de ida y vuelta”. Sigamos los siguientes pasos para probar dicha conversión:

  1. Cargar archivo DOCX de origen
  2. Establezca Exportar información de ida y vuelta en verdadero
  3. Guarde el archivo HTML de salida

El fragmento de código a continuación muestra cómo convertir Word a HTML con información de ida y vuelta usando C++:

// Cargar archivo DOCX de entrada
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// Establecer HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Guardar archivo HTML de salida        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Convertir Word a MHTML en C++

El formato de archivo MHTML es popular ya que contiene todo el contenido en un solo archivo de salida. Puede convertir archivos de Word (DOCX/DOC) a formato MHTML usando C++ con los siguientes pasos:

  1. Cargar archivo DOCX de origen
  2. Guardar la salida en formato MHTML

El fragmento de código a continuación muestra cómo convertir Word a MHTML usando C++:

// Cargue el documento en Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Guarde la salida en formato MHTML.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

Conclusión

Hemos aprendido a convertir Word (DOCX/DOC) a HTML o MHTML con diferentes opciones. También se analizan en detalle varias funciones, como guardar información de ida y vuelta o incrustar fuentes como recursos de Base64. Sin embargo, si tiene alguna pregunta, no dude en comunicarse con nosotros a través del Foro de soporte gratuito.

Ver también