V různých případech může být nutné převést obsah HTML na dokument aplikace Word. Například pro generování dokumentu z WYSIWYG HTML editoru nebo převod webové stránky do formátu DOCX nebo DOC. Chcete-li provést tento převod programově, tento článek popisuje, jak převést soubory HTML do formátu Word DOCX, DOC, DOCM nebo jiných formátů v Javě.
- Knihovna pro převod HTML do Wordu
- Převeďte soubor HTML na DOCX/DOC/DOCM atd.
- Převeďte webovou stránku do aplikace Word pomocí adresy URL
- Převod řetězce HTML do Wordu
Java Library pro převod HTML do Wordu
Pro převod HTML na DOCX, DOC, DOT, DOCM a další formáty Wordu použijeme Aspose.Words for Java. Je to výkonná knihovna pro vytváření a manipulaci s dokumenty Word programově. Kromě toho poskytuje vestavěný konvertor dokumentů, který poskytuje vysoce věrný převod dokumentů pro zpracování textu/do dokumentů. JAR API si můžete stáhnout z části ke stažení nebo jej nainstalovat pomocí následujících konfigurací Maven v pom.xml.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Převod HTML na DOCX/DOC/DOCM v Javě
Pomocí Aspose.Words for Java lze převod souboru HTML do formátu Word provést v několika krocích, které jsou uvedeny níže.
- Načtěte soubor HTML pomocí třídy Document.
- Uložte soubor HTML jako dokument aplikace Word pomocí metody Document.save(string, SaveFormat).
Výčet SaveFormat v metodě Document.save() určuje formát, do kterého chcete soubor HTML převést. Následující ukázka kódu ukazuje, jak vygenerovat dokument aplikace Word z HTML v Javě.
// Načtěte soubor HTML pomocí třídy Document
Document document = new Document("template.html");
// Převeďte soubor HTML do formátu Word DOCX
document.save("output.docx", SaveFormat.DOCX);
Převeďte webovou stránku do Wordu pomocí URL v Javě
Webovou stránku můžete také převést na dokument aplikace Word přímo z její adresy URL. Následují kroky pro převod HTML na DOCX pomocí URL v Javě.
- Vytvořte instanci třídy URL a inicializujte ji požadovanou URL.
- Otevřete URL do objektu InputStream.
- Vytvořte instanci třídy HtmlLoadOptions.
- Vytvořte instanci třídy Document a inicializujte ji pomocí objektů InputStream a HtmlLoadOptions.
- Uložte webovou stránku jako dokument aplikace Word pomocí metody Document.save(string, SaveFormat).
Následující ukázka kódu ukazuje, jak převést webovou stránku na dokument aplikace Word pomocí adresy URL.
// Vytvořte a inicializujte URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");
// Získejte webovou stránku jako vstupní stream
InputStream is = oracleURL.openStream();
// Inicializovat možnosti načítání HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();
// Načíst proud do objektu dokumentu
Document doc = new Document(is, htmloptions);
// Uložit jako DOCX
doc.save("output.docx", SaveFormat.DOCX);
Převeďte řetězec HTML do aplikace Word pomocí Java
Aspose.Words for Java vám také umožňuje dynamicky generovat dokument aplikace Word z řetězce HTML. Následují kroky k provedení této operace.
- Vytvořte instanci třídy Document.
- Vytvořte instanci třídy DocumentBuilder a inicializujte ji pomocí objektu Document.
- Vložte HTML do dokumentu pomocí metody DocumentBuilder.InsertHtml(string).
- Uložte dokument aplikace Word pomocí metody Document.save(string, SaveFormat).
Následující ukázka kódu ukazuje, jak převést řetězec HTML na soubor DOCX pomocí jazyka Java.
// Vytvořte nový dokument
Document doc = new Document();
// Vytvořte tvůrce dokumentů
DocumentBuilder builder = new DocumentBuilder(doc);
// Vložit HTML
builder.insertHtml("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>");
// Uložit jako DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);
Získejte bezplatnou licenci API
Aspose.Words for Java můžete používat bez omezení hodnocení získáním bezplatné dočasné licence.
Závěr
V tomto článku jste se naučili, jak převést soubory HTML do formátu Word DOCX, DOC, DOCM nebo jiných formátů programově pomocí Java. Navíc jste viděli, jak dynamicky převést řetězec HTML nebo webovou stránku z adresy URL do dokumentu aplikace Word. Můžete jednoduše nainstalovat Aspose.Words pro Javu a použít dodaný kód k vytvoření převodníku HTML do Wordu. Kromě toho můžete navštívit dokumentaci a prozkoumat více o Aspose.Words for Java. Kromě toho s námi můžete sdílet své dotazy na našem fóru.
Viz také
- Vytvářejte dokumenty Word bez MS Office pomocí Java
- Převod PDF do Wordu v Javě
- Převést Word do PDF v Javě
Informace: Pokud někdy potřebujete získat dokument aplikace Word z prezentace v PowerPointu, můžete použít převodník Aspose Presentation to Word Document.