XML — это универсальный язык разметки, который используется для различных целей, таких как управление данными, Интернет, инструменты Office, документы и т. д. Поскольку XML удобно обрабатывать компьютерными программами, формат PDF документы часто преобразуются в форматы XML, чтобы получить структурированное представление содержимого. Преобразованный XML использует разные теги для представления документа PDF. В этой статье вы узнаете, как программно преобразовать PDF-файл в XML на Java.
Java API для преобразования PDF в XML — скачать бесплатно
Aspose.PDF for Java — это мощный API для создания PDF-файлов и управления ими. Используя API, вы можете легко создавать, обрабатывать и конвертировать PDF-файлы с простыми и сложными макетами. В этой статье мы будем использовать этот API для преобразования PDF в XML. Вы можете скачать JAR-файл API или установить его, используя следующие конфигурации Maven.
Репозиторий:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
Зависимость:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>22.4</version>
</dependency>
Преобразование PDF в XML в Java
Aspose.PDF поддерживает следующие стандарты XML для преобразования PDF в XML:
- МобиXML
- PDFXML
Вы можете выбрать любой из вышеупомянутых форматов для преобразованного XML-файла. Итак, давайте перейдем к тому, как выполнить преобразование PDF в XML в приложениях Java.
Java Преобразование PDF в MobiXML
Ниже приведены шаги для преобразования PDF в формат MobiXML на Java.
- Загрузите документ PDF с помощью класса Document.
- Преобразуйте PDF в XML с помощью метода Document.save(string, SaveFormat) и передайте SaveFormat.MobiXml в качестве второго параметра.
В следующем примере кода показано, как преобразовать PDF в формат MobiXML на Java.
// Загрузить PDF-документ
Document document = new Document("candy.pdf");
// Сохранить документ в формате MobiXML
document.save("standard-xml-output.xml", SaveFormat.MobiXml);
Преобразование PDF в PdfXML на Java
Чтобы преобразовать PDF в формат PdfXML, вам необходимо передать SaveFormat.PdfXml в качестве второго параметра метода Document.save(string, SaveFormat). В следующем примере кода показано, как преобразовать PDF в формат PdfXML в Java.
// Загрузить PDF-документ
Document document = new Document("candy.pdf");
// Сохранить документ в формате MobiXML
document.save("standard-xml-output.xml", SaveFormat.PdfXml);
Конвертер Java PDF в XML - Получите бесплатную лицензию
Вы можете получить бесплатную временную лицензию, чтобы использовать Aspose.PDF для Java без ограничений пробной версии.
Вывод
В этой статье вы узнали, как преобразовать PDF-документ в XML на Java. Вы видели, как программно конвертировать PDF в формат MobiXML или PdfXML. Кроме того, вы можете посетить документацию, чтобы узнать больше об Aspose.PDF для Java. Если у вас возникнут какие-либо вопросы или вопросы, вы можете связаться с нами через наш форум.