Преобразование файлов PDF в XML в Java

XML — это универсальный язык разметки, который используется для различных целей, таких как управление данными, Интернет, инструменты Office, документы и т. д. Поскольку XML удобно обрабатывать компьютерными программами, формат PDF документы часто преобразуются в форматы XML, чтобы получить структурированное представление содержимого. Преобразованный XML использует разные теги для представления документа PDF. В этой статье вы узнаете, как программно преобразовать PDF-файл в XML на Java.

Java API для преобразования PDF в XML — скачать бесплатно

Aspose.PDF for Java — это мощный API для создания PDF-файлов и управления ими. Используя API, вы можете легко создавать, обрабатывать и конвертировать PDF-файлы с простыми и сложными макетами. В этой статье мы будем использовать этот API для преобразования PDF в XML. Вы можете скачать JAR-файл API или установить его, используя следующие конфигурации Maven.

Репозиторий:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Зависимость:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>22.4</version>
</dependency>

Преобразование PDF в XML в Java

Aspose.PDF поддерживает следующие стандарты XML для преобразования PDF в XML:

  • МобиXML
  • PDFXML

Вы можете выбрать любой из вышеупомянутых форматов для преобразованного XML-файла. Итак, давайте перейдем к тому, как выполнить преобразование PDF в XML в приложениях Java.

Java Преобразование PDF в MobiXML

Ниже приведены шаги для преобразования PDF в формат MobiXML на Java.

В следующем примере кода показано, как преобразовать PDF в формат MobiXML на Java.

// Загрузить PDF-документ
Document document = new Document("candy.pdf");

// Сохранить документ в формате MobiXML
document.save("standard-xml-output.xml", SaveFormat.MobiXml);

Преобразование PDF в PdfXML на Java

Чтобы преобразовать PDF в формат PdfXML, вам необходимо передать SaveFormat.PdfXml в качестве второго параметра метода Document.save(string, SaveFormat). В следующем примере кода показано, как преобразовать PDF в формат PdfXML в Java.

// Загрузить PDF-документ
Document document = new Document("candy.pdf");

// Сохранить документ в формате MobiXML
document.save("standard-xml-output.xml", SaveFormat.PdfXml);

Конвертер Java PDF в XML - Получите бесплатную лицензию

Вы можете получить бесплатную временную лицензию, чтобы использовать Aspose.PDF для Java без ограничений пробной версии.

Вывод

В этой статье вы узнали, как преобразовать PDF-документ в XML на Java. Вы видели, как программно конвертировать PDF в формат MobiXML или PdfXML. Кроме того, вы можете посетить документацию, чтобы узнать больше об Aspose.PDF для Java. Если у вас возникнут какие-либо вопросы или вопросы, вы можете связаться с нами через наш форум.

Смотрите также