Convertir des fichiers PDF en XML en Java

XML est un langage de balisage polyvalent utilisé à des fins multiples, telles que la gestion de données, le Web, les outils Office, les documents, etc. Étant donné que XML est pratique à traiter par des programmes informatiques, le PDF les documents sont souvent convertis en formats XML pour obtenir la représentation structurée du contenu. Le XML converti utilise différentes balises pour représenter le document PDF. Dans cet article, vous apprendrez à convertir un fichier PDF en XML par programmation en Java.

API Java pour convertir PDF en XML - Téléchargement gratuit

Aspose.PDF for Java est une API puissante pour la génération et la manipulation de PDF. À l’aide de l’API, vous pouvez créer, traiter et convertir en toute transparence des fichiers PDF de mises en page simples et complexes. Nous utiliserons cette API pour la conversion PDF en XML dans cet article. Vous pouvez télécharger le JAR de l’API ou l’installer à l’aide des configurations Maven suivantes.

Repository:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Dependency:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>22.4</version>
</dependency>

Convertir PDF en XML en Java

Aspose.PDF prend en charge les normes XML suivantes pour la conversion PDF vers XML :

  • MobiXML
  • PDFXML

Vous pouvez choisir l’un des formats mentionnés ci-dessus pour le fichier XML converti. Voyons donc comment effectuer une conversion PDF vers XML dans les applications Java.

Java Convertir PDF en MobiXML

Voici les étapes pour convertir un PDF au format MobiXML en Java.

L’exemple de code suivant montre comment convertir un PDF au format MobiXML en Java.

// Charger le document PDF
Document document = new Document("candy.pdf");

// Enregistrer le document au format MobiXML
document.save("standard-xml-output.xml", SaveFormat.MobiXml);

Convertir PDF en PdfXML en Java

Pour convertir un PDF au format PdfXML, vous devez passer SaveFormat.PdfXml comme second paramètre de la méthode Document.save(string, SaveFormat). L’exemple de code suivant montre comment convertir un PDF au format PdfXML en Java.

// Charger le document PDF
Document document = new Document("candy.pdf");

// Enregistrer le document au format MobiXML
document.save("standard-xml-output.xml", SaveFormat.PdfXml);

Convertisseur Java PDF en XML - Obtenez une licence gratuite

Vous pouvez obtenir une licence temporaire gratuite afin d’utiliser Aspose.PDF for Java sans limitations d’évaluation.

Conclusion

Dans cet article, vous avez appris à convertir un document PDF en XML en Java. Vous avez vu comment convertir un PDF au format MobiXML ou PdfXML par programmation. De plus, vous pouvez visiter la documentation pour en savoir plus sur Aspose.PDF for Java. Si vous avez des questions ou des questions, vous pouvez nous contacter via notre forum.

Voir également