Konwertuj pliki HTML na Word DOCX DOC w Javie

W różnych przypadkach może być konieczne przekonwertowanie zawartości HTML na dokument programu Word. Na przykład do generowania dokumentu z edytora WYSIWYG HTML lub konwertowania strony internetowej do formatu DOCX lub DOC. Aby wykonać tę konwersję programowo, w tym artykule opisano, jak konwertować pliki HTML na formaty Word DOCX, DOC, DOCM lub inne formaty w Javie.

Biblioteka Java do konwersji HTML na Word

Aby przekonwertować HTML na DOCX, DOC, DOT, DOCM i inne formaty Word, użyjemy Aspose.Words for Java. Jest to potężna biblioteka do programowego tworzenia i manipulowania dokumentami Word. Ponadto zapewnia wbudowany konwerter dokumentów, który zapewnia wysoką wierność konwersji dokumentów edytora Word do formatu Word. Możesz pobrać plik JAR API z sekcji pobierania lub zainstalować go przy użyciu następujących konfiguracji Mavena w pom.xml.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Konwertuj HTML na DOCX/DOC/DOCM w Javie

Używając Aspose.Words for Java, konwersję pliku HTML do formatu Word można wykonać w kilku krokach, które są wymienione poniżej.

Wyliczenie SaveFormat w metodzie Document.save() określa format, w jakim chcesz przekonwertować plik HTML. Poniższy przykładowy kod pokazuje, jak wygenerować dokument Word z HTML w Javie.

// Załaduj plik HTML przy użyciu klasy Document
Document document = new Document("template.html");

// Konwertuj plik HTML do formatu Word DOCX
document.save("output.docx", SaveFormat.DOCX); 

Konwertuj stronę internetową na Word za pomocą adresu URL w Javie

Możesz także przekonwertować stronę internetową na dokument programu Word bezpośrednio z adresu URL. Poniżej przedstawiono kroki konwersji HTML na DOCX przy użyciu adresu URL w Javie.

Poniższy przykładowy kod pokazuje, jak przekonwertować stronę internetową na dokument programu Word przy użyciu adresu URL.

// Utwórz i zainicjuj adres URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// Pobierz stronę internetową jako strumień wejściowy
InputStream is = oracleURL.openStream();

// Zainicjuj opcje ładowania HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// Załaduj strumień do obiektu dokumentu
Document doc = new Document(is, htmloptions);

// Zapisz jako DOCX
doc.save("output.docx", SaveFormat.DOCX);

Konwertuj ciąg HTML na Word za pomocą Java

Aspose.Words for Java umożliwia również dynamiczne generowanie dokumentu Word z ciągu znaków HTML. Poniżej przedstawiono kroki, aby wykonać tę operację.

Poniższy przykładowy kod pokazuje, jak przekonwertować ciąg HTML na plik DOCX przy użyciu języka Java.

// Utwórz nowy dokument
Document doc = new Document();

// Utwórz narzędzie do tworzenia dokumentów
DocumentBuilder builder = new DocumentBuilder(doc);

// Wstaw kod HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// Zapisz jako DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

Uzyskaj bezpłatną licencję API

Możesz używać Aspose.Words for Java bez ograniczeń ewaluacyjnych, otrzymując bezpłatną licencję tymczasową.

Wniosek

W tym artykule nauczyłeś się, jak konwertować pliki HTML do formatów Word DOCX, DOC, DOCM lub innych formatów programowo przy użyciu języka Java. Co więcej, widziałeś, jak dynamicznie konwertować ciąg HTML lub stronę internetową z adresu URL na dokument programu Word. Możesz po prostu zainstalować Aspose.Words for Java i użyć dostarczonego kodu do zbudowania konwertera HTML na Word. Poza tym możesz odwiedzić dokumentację, aby dowiedzieć się więcej o Aspose.Words dla Javy. Ponadto możesz podzielić się z nami swoimi pytaniami na naszym forum.

Zobacz też

Info: Jeśli kiedykolwiek będziesz potrzebował pobrać dokument Word z prezentacji PowerPoint, możesz użyć konwertera Aspose Presentation to Word Document.