Преобразование DOCX в JSON в Java

В некоторых случаях вам необходимо программно экспортировать содержимое файла Word DOCX в файл JSON. Для этого в этой статье представлено простое руководство о том, как преобразовать текст документа DOCX в формат JSON из ваших приложений Java. Вы также узнаете, как программно преобразовать защищенные документы DOCX в JSON. Итак, приступим к преобразованию DOCX в JSON на Java.

Как преобразовать DOCX в JSON в Java

Чтобы преобразовать документ DOCX в формат JSON, нам необходимо выполнить следующие шаги:

  • Загрузите документ DOCX.
  • Преобразуйте его в формат HTML.
  • Сохраните HTML-файл в формате JSON.

Давайте посмотрим, как выполнить эти шаги программно в Java. Для этого вам необходимо установить две библиотеки, упомянутые в следующем разделе.

Библиотеки Java для преобразования DOCX в JSON — скачать бесплатно

Aspose.Words for Java — мощная библиотека, позволяющая создавать и обрабатывать документы MS Word. Мы будем использовать эту библиотеку для экспорта содержимого файла DOCX в HTML. Затем мы будем использовать Aspose.Cells for Java для сохранения содержимого HTML в виде файла JSON. Вы можете загрузить JAR-файлы обеих библиотек или установить их с помощью конфигураций Maven.

Скачать банку

Установить через Мавен

<dependencies>
	<dependency>
		<groupId>com.aspose</groupId>
		<artifactId>aspose-words</artifactId>
		<version>22.7</version>
		<classifier>jdk17</classifier>
	</dependency>
	<dependency>
		<groupId>com.aspose</groupId>
		<artifactId>aspose-cells</artifactId>
		<version>22.7</version>
	</dependency>
</dependencies>
<repositories>
	<repository>
		<id>AsposeJavaAPI</id>
		<name>Aspose Java API</name>
		<url>https://repository.aspose.com/repo/</url>
	</repository>
</repositories>

Преобразование DOCX в JSON в Java

Ниже приведены шаги для преобразования DOCX в JSON в Java.

  • Загрузите документ DOCX, используя класс com.aspose.words.Document.
  • Сохраните документ DOCX как HTML, используя метод Document.Save().
  • Загрузите файл HTML, используя класс com.aspose.cells.Workbook.
  • Преобразуйте документ в формат JSON с помощью метода Workbook.Save().

В следующем примере кода показано, как преобразовать документ DOCX в JSON в Java.

// Загрузите документ Word с помощью Aspose.Words
Document doc = new Document("sample1.docx");

// Сохранить как HTML
doc.save("html_output.html", SaveFormat.HTML);

// Загрузите сохраненный файл HTML с помощью Aspose.Cells
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");

// Сохранить HTML как JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);

Java Преобразование защищенного DOCX в JSON

Вы также можете загрузить защищенные документы DOCX, используя их пароли, и преобразовать их в формат JSON. Ниже приведены шаги для преобразования защищенного документа DOCX в JSON на Java.

В следующем примере кода показано, как преобразовать защищенный документ DOCX в JSON в Java.

// Загрузите документ Word с помощью Aspose.Words
Document doc = new Document("sample1.docx", new com.aspose.words.LoadOptions("MyPassword"));

// Сохранить как HTML
doc.save("html_output.html", SaveFormat.HTML);

// Загрузите сохраненный файл HTML с помощью Aspose.Cells
com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html");

// Сохранить HTML как JSON
book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);

Библиотеки конвертера Java DOCX в JSON — получите бесплатную лицензию

Вы можете получить бесплатную временную лицензию для использования библиотек без ограничений на пробную версию.

Вывод

В этой статье вы узнали, как конвертировать DOCX в JSON на Java. Кроме того, вы видели, как программно преобразовать защищенный паролем документ DOCX в JSON. Кроме того, вы можете посетить документацию Aspose.Words for Java и Aspose.Cells for Java, чтобы изучить другие функции. Если у вас возникнут какие-либо вопросы, сообщите нам об этом через наш форум.

Смотрите также