Converti file PDF in XML in Java

XML è un linguaggio di markup versatile che viene utilizzato per molteplici scopi, come gestione dei dati, Web, strumenti di Office, documenti, ecc. Poiché XML è conveniente per essere elaborato da programmi per computer, il PDF i documenti vengono spesso convertiti in formati XML per ottenere la rappresentazione strutturata del contenuto. L’XML convertito utilizza tag diversi per rappresentare il documento PDF. In questo articolo imparerai come convertire un file PDF in XML in modo programmatico in Java.

API Java per convertire PDF in XML - Download gratuito

Aspose.PDF for Java è una potente API per la generazione e la manipolazione di PDF. Utilizzando l’API, puoi creare, elaborare e convertire senza problemi file PDF di layout semplici e complessi. Useremo questa API per la conversione da PDF a XML in questo articolo. Puoi scaricare il JAR dell’API o installarlo utilizzando le seguenti configurazioni Maven.

Archivio:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Dipendenza:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>22.4</version>
</dependency>

Converti PDF in XML in Java

Aspose.PDF supporta i seguenti standard XML per la conversione da PDF a XML:

  • MobiXML
  • PdfXML

Puoi scegliere uno qualsiasi dei formati sopra menzionati per il file XML convertito. Procediamo quindi a vedere come eseguire la conversione da PDF a XML all’interno delle applicazioni Java.

Java Converti PDF in MobiXML

Di seguito sono riportati i passaggi per convertire un PDF in formato MobiXML in Java.

L’esempio di codice seguente mostra come convertire un PDF in formato MobiXML in Java.

// Carica documento PDF
Document document = new Document("candy.pdf");

// Salva il documento in formato MobiXML
document.save("standard-xml-output.xml", SaveFormat.MobiXml);

Converti PDF in PdfXML in Java

Per convertire un PDF in formato PdfXML, devi passare SaveFormat.PdfXml come secondo parametro del metodo Document.save(string, SaveFormat). L’esempio di codice seguente mostra come convertire un PDF in formato PdfXML in Java.

// Carica documento PDF
Document document = new Document("candy.pdf");

// Salva il documento in formato MobiXML
document.save("standard-xml-output.xml", SaveFormat.PdfXml);

Convertitore da PDF a XML Java - Ottieni una licenza gratuita

Puoi ottenere una licenza temporanea gratuita per utilizzare Aspose.PDF per Java senza limitazioni di valutazione.

Conclusione

In questo articolo, hai imparato come convertire un documento PDF in XML in Java. Hai visto come convertire un PDF in formato MobiXML o PdfXML a livello di codice. Inoltre, puoi visitare la documentazione per saperne di più su Aspose.PDF per Java. In caso di domande o domande, puoi contattarci tramite il nostro forum.

Guarda anche