Convertir PDF a HTML usando C++

PDF es un formato de documento estándar que se usa ampliamente para el intercambio de documentos entre individuos y diferentes organizaciones. Aunque es popular, puede que no siempre sea la opción ideal para mostrar contenido. Por ejemplo, en las páginas web, HTML es la mejor opción para una experiencia de usuario más satisfactoria. Si desea mostrar el contenido PDF en un sitio web, entonces convertirlo a HTML puede resultar útil. A la luz de esto, este artículo le enseñará cómo convertir documentos PDF a formato HTML usando C++.

API de C++ para convertir documentos PDF a formato HTML

Aspose.PDF for C++ es una biblioteca de C++ que le permite crear, leer y actualizar documentos PDF. Además, la API admite la conversión de archivos PDF a formato HTML. Puede instalar la API a través de NuGet o descargarla directamente desde la sección descargas.

PM> Install-Package Aspose.PDF.Cpp

Convierta documentos PDF a formato HTML usando C++

Convertir un documento PDF a formato HTML es muy sencillo con la API de Aspose.PDF for C++. Puede realizar la conversión con solo dos líneas de código. Para convertir un documento PDF a formato HTML, siga los pasos que se indican a continuación.

El siguiente código de ejemplo muestra cómo convertir documentos PDF a formato HTML usando C++.

// Abra el documento PDF de origen
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// Guarde el archivo HTML
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);

Archivo PDF de origen

Archivo PDF de origen utilizado en el código de ejemplo.

Archivo HTML de salida

Archivo HTML de salida generado por el código de muestra

Convierta documentos PDF a formato HTML con opciones adicionales usando C++

La API de Aspose.PDF for C++ le brinda la posibilidad de personalizar el HTML generado por el proceso de conversión. Para ello, la API ofrece la clase HtmlSaveOptions. Las siguientes son algunas de las opciones proporcionadas por la clase HtmlSaveOptions.

Los siguientes son los pasos para convertir un documento PDF a formato HTML con opciones adicionales.

El siguiente es el código de ejemplo de C++ que demuestra el uso de la clase HtmlSaveOptions para personalizar la salida HTML.

// Abra el documento PDF de origen
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// Crear una instancia de la clase HtmlSaveOptions
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();

// Establecer las opciones deseadas
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;

// Guarde el archivo HTML
pdfDocument->Save(u"OutputDirectory\\output.html", options);

Obtenga una licencia gratis

Puede probar la API sin limitaciones de evaluación solicitando una licencia temporal gratuita.

Conclusión

En este artículo, ha aprendido a convertir documentos PDF a formato HTML usando C++. Además, ha aprendido a utilizar las opciones adicionales proporcionadas por la API de Aspose.PDF for C++ para personalizar el HTML generado. La API proporciona muchas funciones adicionales para automatizar sus tareas relacionadas con PDF. Puede explorar la API en detalle utilizando la documentación oficial. Si tiene alguna pregunta, no dude en comunicarse con nosotros en el foro de soporte gratuito.

Ver también