Преобразование файлов HTML в Word DOCX DOC на Java

В различных случаях вам может потребоваться преобразовать содержимое HTML в документ Word. Например, для создания документа из HTML-редактора WYSIWYG или преобразования веб-страницы в формат DOCX или DOC. Чтобы выполнить это преобразование программно, в этой статье рассказывается, как преобразовать файлы HTML в Word DOCX, DOC, DOCM или другие форматы на Java.

Библиотека Java для преобразования HTML в Word

Для преобразования HTML в DOCX, DOC, DOT, DOCM и другие форматы Word мы будем использовать Aspose.Words for Java. Это мощная библиотека для программного создания документов Word и управления ими. Кроме того, он предоставляет встроенный конвертер документов, который обеспечивает высокоточное преобразование/в документы обработки Word. Вы можете загрузить JAR API из раздела загрузок или установить его, используя следующие конфигурации Maven в pom.xml.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Преобразование HTML в DOCX/DOC/DOCM в Java

Используя Aspose.Words for Java, преобразование файла HTML в формат Word можно выполнить за пару шагов, которые упомянуты ниже.

Перечисление SaveFormat в методе Document.save() указывает формат, в который вы хотите преобразовать файл HTML. В следующем примере кода показано, как создать документ Word из HTML в Java.

// Загрузить файл HTML с помощью класса Document
Document document = new Document("template.html");

// Преобразование файла HTML в формат Word DOCX
document.save("output.docx", SaveFormat.DOCX); 

Преобразование веб-страницы в Word с использованием URL-адреса в Java

Вы также можете преобразовать веб-страницу в документ Word непосредственно из ее URL-адреса. Ниже приведены шаги для преобразования HTML в DOCX с использованием URL-адреса в Java.

  • Создайте экземпляр класса URL и инициализируйте его нужным URL.
  • Откройте URL в объекте InputStream.
  • Создайте экземпляр класса HtmlLoadOptions.
  • Создайте экземпляр класса Document и инициализируйте его объектами InputStream и HtmlLoadOptions.
  • Сохраните веб-страницу как документ Word, используя метод Document.save(string, SaveFormat).

В следующем примере кода показано, как преобразовать веб-страницу в документ Word с помощью URL-адреса.

// Создать и инициализировать URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// Получить веб-страницу в качестве входного потока
InputStream is = oracleURL.openStream();

// Инициализировать параметры загрузки HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// Загрузить поток в объект документа
Document doc = new Document(is, htmloptions);

// Сохранить как DOCX
doc.save("output.docx", SaveFormat.DOCX);

Преобразование строки HTML в Word с помощью Java

Aspose.Words for Java также позволяет динамически генерировать документ Word из строки HTML. Ниже приведены шаги для выполнения этой операции.

В следующем примере кода показано, как преобразовать строку HTML в файл DOCX с помощью Java.

// Создать новый документ
Document doc = new Document();

// Создать конструктор документов
DocumentBuilder builder = new DocumentBuilder(doc);

// Вставить HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// Сохранить как DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

Получите бесплатную лицензию API

Вы можете использовать Aspose.Words for Java без ограничений по ознакомительной версии, получив бесплатную временную лицензию.

Вывод

В этой статье вы узнали, как программно конвертировать HTML-файлы в Word DOCX, DOC, DOCM или другие форматы с помощью Java. Кроме того, вы видели, как динамически преобразовать строку HTML или веб-страницу из URL-адреса в документ Word. Вы можете просто установить Aspose.Words для Java и использовать предоставленный код для создания конвертера HTML в Word. Кроме того, вы можете посетить документацию, чтобы узнать больше об Aspose.Words for Java. Кроме того, вы можете поделиться своими вопросами с нами на нашем форуме.

Смотрите также

Информация: Если вам когда-нибудь понадобится получить документ Word из презентации PowerPoint, вы можете использовать конвертер Aspose Presentation to Word Document.