Převod HTML souborů do Word DOCX DOC v Javě

V různých případech může být nutné převést obsah HTML na dokument aplikace Word. Například pro generování dokumentu z WYSIWYG HTML editoru nebo převod webové stránky do formátu DOCX nebo DOC. Chcete-li provést tento převod programově, tento článek popisuje, jak převést soubory HTML do formátu Word DOCX, DOC, DOCM nebo jiných formátů v Javě.

Java Library pro převod HTML do Wordu

Pro převod HTML na DOCX, DOC, DOT, DOCM a další formáty Wordu použijeme Aspose.Words for Java. Je to výkonná knihovna pro vytváření a manipulaci s dokumenty Word programově. Kromě toho poskytuje vestavěný konvertor dokumentů, který poskytuje vysoce věrný převod dokumentů pro zpracování textu/do dokumentů. JAR API si můžete stáhnout z části ke stažení nebo jej nainstalovat pomocí následujících konfigurací Maven v pom.xml.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Převod HTML na DOCX/DOC/DOCM v Javě

Pomocí Aspose.Words for Java lze převod souboru HTML do formátu Word provést v několika krocích, které jsou uvedeny níže.

Výčet SaveFormat v metodě Document.save() určuje formát, do kterého chcete soubor HTML převést. Následující ukázka kódu ukazuje, jak vygenerovat dokument aplikace Word z HTML v Javě.

// Načtěte soubor HTML pomocí třídy Document
Document document = new Document("template.html");

// Převeďte soubor HTML do formátu Word DOCX
document.save("output.docx", SaveFormat.DOCX); 

Převeďte webovou stránku do Wordu pomocí URL v Javě

Webovou stránku můžete také převést na dokument aplikace Word přímo z její adresy URL. Následují kroky pro převod HTML na DOCX pomocí URL v Javě.

  • Vytvořte instanci třídy URL a inicializujte ji požadovanou URL.
  • Otevřete URL do objektu InputStream.
  • Vytvořte instanci třídy HtmlLoadOptions.
  • Vytvořte instanci třídy Document a inicializujte ji pomocí objektů InputStream a HtmlLoadOptions.
  • Uložte webovou stránku jako dokument aplikace Word pomocí metody Document.save(string, SaveFormat).

Následující ukázka kódu ukazuje, jak převést webovou stránku na dokument aplikace Word pomocí adresy URL.

// Vytvořte a inicializujte URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// Získejte webovou stránku jako vstupní stream
InputStream is = oracleURL.openStream();

// Inicializovat možnosti načítání HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// Načíst proud do objektu dokumentu
Document doc = new Document(is, htmloptions);

// Uložit jako DOCX
doc.save("output.docx", SaveFormat.DOCX);

Převeďte řetězec HTML do aplikace Word pomocí Java

Aspose.Words for Java vám také umožňuje dynamicky generovat dokument aplikace Word z řetězce HTML. Následují kroky k provedení této operace.

Následující ukázka kódu ukazuje, jak převést řetězec HTML na soubor DOCX pomocí jazyka Java.

// Vytvořte nový dokument
Document doc = new Document();

// Vytvořte tvůrce dokumentů
DocumentBuilder builder = new DocumentBuilder(doc);

// Vložit HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// Uložit jako DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

Získejte bezplatnou licenci API

Aspose.Words for Java můžete používat bez omezení hodnocení získáním bezplatné dočasné licence.

Závěr

V tomto článku jste se naučili, jak převést soubory HTML do formátu Word DOCX, DOC, DOCM nebo jiných formátů programově pomocí Java. Navíc jste viděli, jak dynamicky převést řetězec HTML nebo webovou stránku z adresy URL do dokumentu aplikace Word. Můžete jednoduše nainstalovat Aspose.Words pro Javu a použít dodaný kód k vytvoření převodníku HTML do Wordu. Kromě toho můžete navštívit dokumentaci a prozkoumat více o Aspose.Words for Java. Kromě toho s námi můžete sdílet své dotazy na našem fóru.

Viz také

Informace: Pokud někdy potřebujete získat dokument aplikace Word z prezentace v PowerPointu, můžete použít převodník Aspose Presentation to Word Document.