Перетворення HTML-файлів у Word DOCX DOC у Java

У різних випадках вам може знадобитися перетворити вміст HTML на документ Word. Наприклад, для створення документа з редактора WYSIWYG HTML або перетворення веб-сторінки у формат DOCX або DOC. Щоб виконати це перетворення програмним шляхом, у цій статті описано, як конвертувати файли HTML у Word DOCX, DOC, DOCM або інші формати на Java.

Бібліотека Java для перетворення HTML у Word

Щоб конвертувати HTML у DOCX, DOC, DOT, DOCM та інші формати Word, ми будемо використовувати Aspose.Words for Java. Це потужна бібліотека для програмного створення та обробки документів Word. Крім того, він надає вбудований конвертер документів, який забезпечує високу точність перетворення документів для обробки Word. Ви можете завантажити JAR API з розділу завантажень або встановити його за допомогою наведених нижче конфігурацій Maven у pom.xml.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Перетворення HTML на DOCX/DOC/DOCM у Java

Використовуючи Aspose.Words for Java, перетворення файлу HTML у формат Word можна виконати за кілька кроків, які описано нижче.

  • Завантажте файл HTML за допомогою класу Document.
  • Збережіть файл HTML як документ Word за допомогою методу Document.save(string, SaveFormat).

Перелік SaveFormat у методі Document.save() визначає формат, у який потрібно перетворити файл HTML. У наведеному нижче прикладі коду показано, як створити документ Word із HTML у Java.

// Завантажте файл HTML за допомогою класу документа
Document document = new Document("template.html");

// Перетворення файлу HTML у формат Word DOCX
document.save("output.docx", SaveFormat.DOCX); 

Перетворіть веб-сторінку на Word за допомогою URL-адреси в Java

Ви також можете перетворити веб-сторінку на документ Word безпосередньо з її URL-адреси. Нижче наведено кроки для перетворення HTML у DOCX за допомогою URL-адреси в Java.

  • Створіть екземпляр класу URL та ініціалізуйте його потрібною URL-адресою.
  • Відкрийте URL-адресу в об’єкті InputStream.
  • Створіть екземпляр класу HtmlLoadOptions.
  • Створіть екземпляр класу Document та ініціалізуйте його об’єктами InputStream і HtmlLoadOptions.
  • Збережіть веб-сторінку як документ Word за допомогою методу Document.save(string, SaveFormat).

У наведеному нижче прикладі коду показано, як перетворити веб-сторінку на документ Word за допомогою URL-адреси.

// Створення та ініціалізація URL-адреси
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// Отримати веб-сторінку як вхідний потік
InputStream is = oracleURL.openStream();

// Ініціалізувати параметри завантаження HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// Завантажити потік в об'єкт Document
Document doc = new Document(is, htmloptions);

// Зберегти як DOCX
doc.save("output.docx", SaveFormat.DOCX);

Перетворіть рядок HTML у Word за допомогою Java

Aspose.Words for Java також дозволяє динамічно генерувати документ Word із рядка HTML. Нижче наведено кроки для виконання цієї операції.

У наведеному нижче прикладі коду показано, як перетворити рядок HTML у файл DOCX за допомогою Java.

// Створіть новий документ
Document doc = new Document();

// Створіть конструктор документів
DocumentBuilder builder = new DocumentBuilder(doc);

// Вставте HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// Зберегти як DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

Отримайте безкоштовну ліцензію API

Ви можете використовувати Aspose.Words for Java без оціночних обмежень, отримавши безкоштовну тимчасову ліцензію.

Висновок

У цій статті ви дізналися, як програмно конвертувати файли HTML у Word DOCX, DOC, DOCM або інші формати за допомогою Java. Крім того, ви бачили, як динамічно перетворювати рядок HTML або веб-сторінку з URL-адреси на документ Word. Ви можете просто встановити Aspose.Words for Java та використати наданий код для створення конвертера HTML у Word. Крім того, ви можете відвідати документацію, щоб дізнатися більше про Aspose.Words for Java. Крім того, ви можете поділитися своїми запитами з нами на нашому форумі.

Дивись також

Інформація: якщо вам коли-небудь знадобиться отримати документ Word із презентації PowerPoint, ви можете скористатися конвертером Aspose Презентація в документ Word.