Konwertuj pliki PDF na XML w Javie

XML to wszechstronny język znaczników, który jest używany do wielu celów, takich jak zarządzanie danymi, Internet, narzędzia Office, dokumenty itp. Ponieważ XML jest wygodny do przetwarzania przez programy komputerowe, PDF dokumenty są często konwertowane do formatów XML, aby uzyskać uporządkowaną reprezentację treści. Przekonwertowany plik XML używa różnych znaczników do reprezentowania dokumentu PDF. W tym artykule dowiesz się, jak programowo przekonwertować plik PDF na XML w Javie.

Java API do konwersji plików PDF na XML — bezpłatne pobieranie

Aspose.PDF for Java to potężny interfejs API do generowania plików PDF i manipulowania nimi. Korzystając z interfejsu API, możesz bezproblemowo tworzyć, przetwarzać i konwertować pliki PDF o prostych i złożonych układach. W tym artykule użyjemy tego interfejsu API do konwersji plików PDF na XML. Możesz pobrać JAR API lub zainstalować go przy użyciu następujących konfiguracji Mavena.

Magazyn:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Zależność:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>22.4</version>
</dependency>

Konwertuj PDF na XML w Javie

Aspose.PDF obsługuje następujące standardy XML dla konwersji plików PDF na XML:

  • MobiXML
  • PDFXML

Możesz wybrać dowolny z wyżej wymienionych formatów dla przekonwertowanego pliku XML. Zobaczmy więc, jak wykonać konwersję PDF do XML w aplikacjach Java.

Java Konwertuj pliki PDF na MobiXML

Poniżej przedstawiono kroki konwersji pliku PDF na format MobiXML w Javie.

Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na format MobiXML w Javie.

// Załaduj dokument PDF
Document document = new Document("candy.pdf");

// Zapisz dokument w formacie MobiXML
document.save("standard-xml-output.xml", SaveFormat.MobiXml);

Konwertuj PDF na PdfXML w Javie

Aby przekonwertować plik PDF do formatu PdfXML, należy przekazać SaveFormat.PdfXml jako drugi parametr metody Document.save(string, SaveFormat). Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na format PdfXML w Javie.

// Załaduj dokument PDF
Document document = new Document("candy.pdf");

// Zapisz dokument w formacie MobiXML
document.save("standard-xml-output.xml", SaveFormat.PdfXml);

Konwerter Java PDF na XML — uzyskaj bezpłatną licencję

Możesz uzyskać bezpłatną tymczasową licencję, aby używać Aspose.PDF for Java bez ograniczeń ewaluacyjnych.

Wniosek

W tym artykule nauczyłeś się, jak przekonwertować dokument PDF na XML w Javie. Widziałeś, jak programowo przekonwertować plik PDF na format MobiXML lub PdfXML. Ponadto możesz odwiedzić dokumentację, aby dowiedzieć się więcej o Aspose.PDF dla Javy. W przypadku jakichkolwiek pytań lub wątpliwości możesz skontaktować się z nami za pośrednictwem naszego forum.

Zobacz też