Konvertieren Sie HTML Dateien in Word DOCX DOC in Java

In verschiedenen Fällen müssen Sie möglicherweise den HTML-Inhalt in ein Word Dokument konvertieren. Beispielsweise zum Generieren des Dokuments aus einem WYSIWYG-HTML-Editor oder zum Konvertieren einer Webseite in das DOCX oder DOC-Format. Um diese Konvertierung programmgesteuert durchzuführen, beschreibt dieser Artikel, wie HTML Dateien in Word DOCX, DOC, DOCM oder andere Formate in Java konvertiert werden.

Java Bibliothek zum Konvertieren von HTML in Word

Um HTML in DOCX, DOC, DOT, DOCM und andere Word-Formate zu konvertieren, verwenden wir Aspose.Words for Java. Es ist eine leistungsstarke Bibliothek zum programmgesteuerten Erstellen und Bearbeiten von Word Dokumenten. Darüber hinaus bietet es einen integrierten Dokumentkonverter, der eine High-Fidelity-Konvertierung von/in Textverarbeitungsdokumente ermöglicht. Sie können die JAR Datei der API aus dem Download Bereich herunterladen oder sie mit den folgenden Maven konfigurationen in pom.xml installieren.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Konvertieren Sie HTML in Java in DOCX/DOC/DOCM

Mit Aspose.Words for Java kann die Konvertierung einer HTML Datei in das Word Format in ein paar Schritten durchgeführt werden, die unten aufgeführt sind.

Die Aufzählung SaveFormat in der Methode Document.save() gibt das Format an, in das Sie die HTML Datei konvertieren möchten. Das folgende Codebeispiel zeigt, wie Sie ein Word Dokument aus HTML in Java generieren.

// Laden Sie die HTML Datei mit der Document Klasse
Document document = new Document("template.html");

// Konvertieren Sie die HTML Datei in das Word-DOCX-Format
document.save("output.docx", SaveFormat.DOCX); 

Konvertieren Sie eine Webseite mit URL in Java in Word

Sie können eine Webseite auch direkt von ihrer URL in ein Word Dokument konvertieren. Im Folgenden sind die Schritte zum Konvertieren von HTML in DOCX mithilfe von URL in Java aufgeführt.

  • Erstellen Sie eine Instanz der Klasse URL und initialisieren Sie sie mit der gewünschten URL.
  • URL in einem InputStream objekt öffnen.
  • Erstellen Sie eine Instanz der Klasse HtmlLoadOptions.
  • Erstellen Sie eine Instanz der Klasse Document und initialisieren Sie sie mit den Objekten InputStream und HtmlLoadOptions.
  • Speichern Sie die Webseite als Word Dokument mit der methode Document.save(string, SaveFormat).

Das folgende Codebeispiel zeigt, wie Sie eine Webseite mithilfe einer URL in ein Word Dokument konvertieren.

// URL erstellen und initialisieren
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// Webseite als Eingabestrom erhalten
InputStream is = oracleURL.openStream();

// HTML-Ladeoptionen initialisieren
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// Stream in Document objekt laden
Document doc = new Document(is, htmloptions);

// Als DOCX speichern
doc.save("output.docx", SaveFormat.DOCX);

Konvertieren Sie einen HTML String mit Java in Word {#HTML String-to-Word-Conversion}

Aspose.Words for Java ermöglicht es Ihnen auch, ein Word Dokument dynamisch aus einem HTML String zu generieren. Im Folgenden sind die Schritte zum Ausführen dieses Vorgangs aufgeführt.

Das folgende Codebeispiel zeigt, wie Sie eine HTML-Zeichenfolge mit Java in eine DOCX Datei konvertieren.

// Erstellen Sie ein neues Dokument
Document doc = new Document();

// Erstellen Sie einen Dokumentenersteller
DocumentBuilder builder = new DocumentBuilder(doc);

// HTML einfügen
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// Als DOCX speichern
doc.save("HTML String-to-word.docx", SaveFormat.DOCX);

Holen Sie sich eine kostenlose API Lizenz

Sie können Aspose.Words for Java ohne Evaluierungseinschränkungen verwenden, indem Sie eine kostenlose temporäre Lizenz erwerben.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie HTML Dateien mithilfe von Java programmgesteuert in Word DOCX, DOC, DOCM oder andere Formate konvertieren. Außerdem haben Sie gesehen, wie Sie einen HTML String oder eine Webseite dynamisch von einer URL in ein Word Dokument konvertieren. Sie können einfach Aspose.Words for Java installieren und den bereitgestellten Code verwenden, um Ihren HTML zu Word Konverter zu erstellen. Außerdem können Sie die Dokumentation besuchen, um mehr über Aspose.Words for Java zu erfahren. Darüber hinaus können Sie uns Ihre Fragen in unserem Forum mitteilen.

Siehe auch

Info: Wenn Sie jemals ein Word Dokument aus einer PowerPoint Präsentation erhalten müssen, können Sie den Konverter Aspose Presentation to Word Document verwenden.