Konvertieren Sie PDF-Dateien in XML in Java

XML ist eine vielseitige Auszeichnungssprache, die für verschiedene Zwecke verwendet wird, z. B. Datenverwaltung, Web, Office-Tools, Dokumente usw. Da XML bequem von Computerprogrammen verarbeitet werden kann, ist PDF Dokumente werden häufig in XML-Formate konvertiert, um eine strukturierte Darstellung des Inhalts zu erhalten. Das konvertierte XML verwendet verschiedene Tags, um das PDF-Dokument darzustellen. In diesem Artikel erfahren Sie, wie Sie eine PDF-Datei programmgesteuert in Java in XML konvertieren.

Java-API zum Konvertieren von PDF in XML – kostenloser Download

Aspose.PDF for Java ist eine leistungsstarke API für die PDF-Generierung und -Bearbeitung. Mit der API können Sie PDF-Dateien mit einfachen und komplexen Layouts nahtlos erstellen, verarbeiten und konvertieren. Wir werden diese API in diesem Artikel für die PDF-zu-XML-Konvertierung verwenden. Sie können die JAR-Datei der API herunterladen oder sie mit den folgenden Maven-Konfigurationen installieren.

Repository:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Abhängigkeit:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>22.4</version>
</dependency>

Konvertieren Sie PDF in XML in Java

Aspose.PDF unterstützt die folgenden XML-Standards für die Konvertierung von PDF in XML:

  • MobiXML
  • PdfXML

Sie können jedes der oben genannten Formate für die konvertierte XML-Datei auswählen. Sehen wir uns also an, wie man eine PDF-zu-XML-Konvertierung in Java-Anwendungen durchführt.

Java PDF in MobiXML konvertieren

Im Folgenden sind die Schritte zum Konvertieren einer PDF-Datei in das MobiXML-Format in Java aufgeführt.

Das folgende Codebeispiel zeigt, wie Sie eine PDF-Datei in das MobiXML-Format in Java konvertieren.

// PDF-Dokument laden
Document document = new Document("candy.pdf");

// Dokument im MobiXML-Format speichern
document.save("standard-xml-output.xml", SaveFormat.MobiXml);

Konvertieren Sie PDF in PdfXML in Java

Um ein PDF in das PdfXML-Format zu konvertieren, müssen Sie SaveFormat.PdfXml als zweiten Parameter der Methode Document.save(string, SaveFormat) übergeben. Das folgende Codebeispiel zeigt, wie Sie eine PDF-Datei in das PdfXML-Format in Java konvertieren.

// PDF-Dokument laden
Document document = new Document("candy.pdf");

// Dokument im MobiXML-Format speichern
document.save("standard-xml-output.xml", SaveFormat.PdfXml);

Java PDF to XML Converter - Holen Sie sich eine kostenlose Lizenz

Sie können eine kostenlose temporäre Lizenz erhalten, um Aspose.PDF für Java ohne Evaluierungseinschränkungen zu verwenden.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie ein PDF-Dokument in Java in XML konvertieren. Sie haben gesehen, wie Sie eine PDF-Datei programmgesteuert in das MobiXML- oder PdfXML-Format konvertieren. Außerdem können Sie die Dokumentation besuchen, um mehr über Aspose.PDF für Java zu erfahren. Falls Sie Fragen oder Anregungen haben, können Sie uns über unser Forum kontaktieren.

Siehe auch