
В различных случаях вам может потребоваться преобразовать содержимое HTML в документ Word. Например, для создания документа из HTML-редактора WYSIWYG или преобразования веб-страницы в формат DOCX или DOC. Чтобы выполнить это преобразование программно, в этой статье рассказывается, как преобразовать файлы HTML в Word DOCX, DOC, DOCM или другие форматы на Java.
- Библиотека для преобразования HTML в Word
- Преобразование HTML-файла в DOCX/DOC/DOCM и т. д.
- Преобразование веб-страницы в Word с использованием URL-адреса
- Преобразование строки HTML в слово
Библиотека Java для преобразования HTML в Word
Для преобразования HTML в DOCX, DOC, DOT, DOCM и другие форматы Word мы будем использовать Aspose.Words for Java. Это мощная библиотека для программного создания документов Word и управления ими. Кроме того, он предоставляет встроенный конвертер документов, который обеспечивает высокоточное преобразование/в документы обработки Word. Вы можете загрузить JAR API из раздела загрузок или установить его, используя следующие конфигурации Maven в pom.xml.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Преобразование HTML в DOCX/DOC/DOCM в Java
Используя Aspose.Words for Java, преобразование файла HTML в формат Word можно выполнить за пару шагов, которые упомянуты ниже.
- Загрузите файл HTML с помощью класса Document.
- Сохраните файл HTML как документ Word, используя метод Document.save(string, SaveFormat).
Перечисление SaveFormat в методе Document.save() указывает формат, в который вы хотите преобразовать файл HTML. В следующем примере кода показано, как создать документ Word из HTML в Java.
// Загрузить файл HTML с помощью класса Document
Document document = new Document("template.html");
// Преобразование файла HTML в формат Word DOCX
document.save("output.docx", SaveFormat.DOCX);
Преобразование веб-страницы в Word с использованием URL-адреса в Java
Вы также можете преобразовать веб-страницу в документ Word непосредственно из ее URL-адреса. Ниже приведены шаги для преобразования HTML в DOCX с использованием URL-адреса в Java.
- Создайте экземпляр класса URL и инициализируйте его нужным URL.
- Откройте URL в объекте InputStream.
- Создайте экземпляр класса HtmlLoadOptions.
- Создайте экземпляр класса Document и инициализируйте его объектами InputStream и HtmlLoadOptions.
- Сохраните веб-страницу как документ Word, используя метод Document.save(string, SaveFormat).
В следующем примере кода показано, как преобразовать веб-страницу в документ Word с помощью URL-адреса.
// Создать и инициализировать URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");
// Получить веб-страницу в качестве входного потока
InputStream is = oracleURL.openStream();
// Инициализировать параметры загрузки HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();
// Загрузить поток в объект документа
Document doc = new Document(is, htmloptions);
// Сохранить как DOCX
doc.save("output.docx", SaveFormat.DOCX);
Преобразование строки HTML в Word с помощью Java
Aspose.Words for Java также позволяет динамически генерировать документ Word из строки HTML. Ниже приведены шаги для выполнения этой операции.
- Создайте экземпляр класса Document.
- Создайте экземпляр класса DocumentBuilder и инициализируйте его с помощью объекта Document.
- Вставьте HTML в документ, используя метод DocumentBuilder.InsertHtml(string).
- Сохраните документ Word, используя метод Document.save(string, SaveFormat).
В следующем примере кода показано, как преобразовать строку HTML в файл DOCX с помощью Java.
// Создать новый документ
Document doc = new Document();
// Создать конструктор документов
DocumentBuilder builder = new DocumentBuilder(doc);
// Вставить HTML
builder.insertHtml("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>");
// Сохранить как DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);
Получите бесплатную лицензию API
Вы можете использовать Aspose.Words for Java без ограничений по ознакомительной версии, получив бесплатную временную лицензию.
Вывод
В этой статье вы узнали, как программно конвертировать HTML-файлы в Word DOCX, DOC, DOCM или другие форматы с помощью Java. Кроме того, вы видели, как динамически преобразовать строку HTML или веб-страницу из URL-адреса в документ Word. Вы можете просто установить Aspose.Words для Java и использовать предоставленный код для создания конвертера HTML в Word. Кроме того, вы можете посетить документацию, чтобы узнать больше об Aspose.Words for Java. Кроме того, вы можете поделиться своими вопросами с нами на нашем форуме.
Смотрите также
- Создавайте документы Word без MS Office с помощью Java
- Конвертировать PDF в Word на Java
- Преобразование Word в PDF на Java
Информация: Если вам когда-нибудь понадобится получить документ Word из презентации PowerPoint, вы можете использовать конвертер Aspose Presentation to Word Document.