Vous devrez souvent convertir un fichier PDF en HTML pour l’intégrer dans une page Web. Afin d’effectuer cette conversion par programme, cet article explique comment convertir un fichier PDF en HTML à l’aide de Java. De plus, vous apprendrez à utiliser des options supplémentaires pour personnaliser la conversion PDF en HTML.
- API Java pour la conversion PDF en HTML
- Convertir des fichiers PDF en HTML
- PDF vers HTML avec des options supplémentaires
API Java pour la conversion PDF en HTML
Afin de convertir des fichiers PDF en HTML, nous utiliserons Aspose.PDF for Java. Il s’agit d’une API de manipulation PDF riche en fonctionnalités qui vous permet de générer, modifier et convertir des fichiers PDF. De plus, il fournit des méthodes faciles à utiliser pour convertir des PDF en pages HTML. Vous pouvez soit télécharger l’API ou l’installer à l’aide des configurations Maven suivantes.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Convertir PDF en HTML en Java
Voici les étapes pour convertir un fichier PDF en HTML à l’aide de Java.
- Chargez le document PDF à l’aide de la classe Document.
- Convertissez un PDF en HTML à l’aide de la méthode Document.save(“pdf-to-html.html”, SaveFormat.Html).
L’exemple de code suivant montre comment convertir des fichiers PDF en HTML.
// Charger le document PDF source
Document pdfDocument = new Document("PDFToHTML.pdf");
// Enregistrez le fichier PDF au format HTML
pdfDocument.save("pdf-to-html.html", SaveFormat.Html);
Java PDF vers HTML avec des options supplémentaires
Aspose.PDF for Java fournit également des options supplémentaires pour personnaliser la conversion PDF en HTML. Par exemple, vous pouvez compresser les images, diviser la sortie en plusieurs pages HTML, spécifier un dossier pour les images, etc. Voici les étapes pour spécifier des options supplémentaires pour la conversion PDF en HTML.
- Chargez le document PDF à l’aide de la classe Document.
- Créez une instance de la classe HtmlSaveOptions.
- Définissez les options souhaitées telles que HtmlOptions.setSplitIntoPages(true) pour diviser le contenu HTML en plusieurs pages.
- Convertissez un PDF en HTML à l’aide de la méthode Document.save(“pdf-to-html.html”, HtmlSaveOptions).
L’exemple de code suivant montre comment personnaliser la conversion PDF vers HTML.
// Charger le document PDF source
Document pdfDocument = new Document("PDFToHTML.pdf");
// Instancier HTMLSaveOptions
HtmlSaveOptions htmlOptions = new HtmlSaveOptions();
// Diviser la sortie en plusieurs pages
htmlOptions.setSplitIntoPages(true);
// Enregistrez le fichier PDF au format HTML
pdfDocument.save("pdf-to-html.html", htmlOptions);
Vous pouvez explorer d’autres options en utilisant les liens de documentation suivants.
- Évitez d’enregistrer des images au format SVG
- Compression des images SVG lors de la conversion
- Spécifier le dossier d’images
- Créer des fichiers suivants avec le contenu du corps uniquement
- Rendu de texte transparent
- Rendu des couches de documents PDF
- Exclure les ressources de police
Obtenez une licence gratuite
Vous pouvez utiliser Aspose.PDF for Java sans limitations d’évaluation à l’aide de la licence temporaire. Obtenez le vôtre maintenant.
Conclusion
Dans cet article, vous avez appris à convertir des fichiers PDF en HTML à l’aide de Java. De plus, vous avez vu comment utiliser différentes options pour personnaliser la conversion PDF en HTML. Vous pouvez en savoir plus sur l’API à l’aide de la documentation. De plus, vous pouvez poster vos questions sur notre forum.