PDF es un formato de documento estándar que se usa ampliamente para el intercambio de documentos entre individuos y diferentes organizaciones. Aunque es popular, puede que no siempre sea la opción ideal para mostrar contenido. Por ejemplo, en las páginas web, HTML es la mejor opción para una experiencia de usuario más satisfactoria. Si desea mostrar el contenido PDF en un sitio web, entonces convertirlo a HTML puede resultar útil. A la luz de esto, este artículo le enseñará cómo convertir documentos PDF a formato HTML usando C++.
- API de C++ para convertir documentos PDF a formato HTML
- Convierta documentos PDF a formato HTML usando C++
- Convierta documentos PDF a formato HTML con opciones adicionales usando C++
API de C++ para convertir documentos PDF a formato HTML
Aspose.PDF for C++ es una biblioteca de C++ que le permite crear, leer y actualizar documentos PDF. Además, la API admite la conversión de archivos PDF a formato HTML. Puede instalar la API a través de NuGet o descargarla directamente desde la sección descargas.
PM> Install-Package Aspose.PDF.Cpp
Convierta documentos PDF a formato HTML usando C++
Convertir un documento PDF a formato HTML es muy sencillo con la API de Aspose.PDF for C++. Puede realizar la conversión con solo dos líneas de código. Para convertir un documento PDF a formato HTML, siga los pasos que se indican a continuación.
- Cargue el documento PDF utilizando la clase Document.
- Guarde la salida HTML usando el método Document->Save(System::String outputFileName, SaveFormat format).
El siguiente código de ejemplo muestra cómo convertir documentos PDF a formato HTML usando C++.
// Abra el documento PDF de origen
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");
// Guarde el archivo HTML
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);
Archivo PDF de origen
Archivo HTML de salida
Convierta documentos PDF a formato HTML con opciones adicionales usando C++
La API de Aspose.PDF for C++ le brinda la posibilidad de personalizar el HTML generado por el proceso de conversión. Para ello, la API ofrece la clase HtmlSaveOptions. Las siguientes son algunas de las opciones proporcionadas por la clase HtmlSaveOptions.
- FontSavingMode: se utiliza para establecer el modo de ahorro de fuente utilizado durante la conversión. La enumeración FontSavingModes se utiliza para establecer su valor.
- RasterImagesSavingMode: se utiliza para establecer cómo se deben manejar las imágenes ráster durante la conversión. La enumeración RasterImagesSavingModes se usa para establecer su valor.
- LettersPositioningMethod: Establece el posicionamiento de las letras en las palabras. La enumeración LettersPositioningMethods se utiliza para establecer su valor.
- SpecialFolderForAllImages: Se utiliza para establecer la ruta donde se guardarán las imágenes.
- SplitIntoPages: Establece si cada página del PDF debe convertirse como una página HTML separada o si todo el documento debe convertirse en un solo archivo HTML.
- SplitCssIntoPages: cuando SplitIntoPages se establece en verdadero, SplitCssIntoPages establece si el CSS debe guardarse como un solo archivo o como un archivo separado para cada página HTML.
Los siguientes son los pasos para convertir un documento PDF a formato HTML con opciones adicionales.
- Cargue el documento PDF utilizando la clase Document.
- Cree una instancia de la clase HtmlSaveOptions.
- Configure las opciones deseadas.
- Guarde la salida HTML usando Document->Save(System::String outputFileName, System::SharedPtr opciones) método.
El siguiente es el código de ejemplo de C++ que demuestra el uso de la clase HtmlSaveOptions para personalizar la salida HTML.
// Abra el documento PDF de origen
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");
// Crear una instancia de la clase HtmlSaveOptions
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();
// Establecer las opciones deseadas
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;
// Guarde el archivo HTML
pdfDocument->Save(u"OutputDirectory\\output.html", options);
Obtenga una licencia gratis
Puede probar la API sin limitaciones de evaluación solicitando una licencia temporal gratuita.
Conclusión
En este artículo, ha aprendido a convertir documentos PDF a formato HTML usando C++. Además, ha aprendido a utilizar las opciones adicionales proporcionadas por la API de Aspose.PDF for C++ para personalizar el HTML generado. La API proporciona muchas funciones adicionales para automatizar sus tareas relacionadas con PDF. Puede explorar la API en detalle utilizando la documentación oficial. Si tiene alguna pregunta, no dude en comunicarse con nosotros en el foro de soporte gratuito.