Konvertera HTML-filer till Word DOCX DOC i Java

I olika fall kan du behöva konvertera HTML-innehållet till ett Word-dokument. Till exempel för att generera dokumentet från en WYSIWYG HTML-redigerare eller konvertera en webbsida till DOCX- eller DOC-format. För att utföra denna konvertering programmatiskt beskriver den här artikeln hur du konverterar HTML-filer till Word DOCX, DOC, DOCM eller andra format i Java.

Java-bibliotek för att konvertera HTML till Word

För att konvertera HTML till DOCX, DOC, DOT, DOCM och andra Word-format kommer vi att använda Aspose.Words for Java. Det är ett kraftfullt bibliotek för att skapa och manipulera Word-dokument programmatiskt. Dessutom tillhandahåller den en inbyggd dokumentomvandlare som ger högtroget konvertering av/till ordbehandlingsdokument. Du kan ladda ner API:s JAR från nedladdningssektionen eller installera den med hjälp av följande Maven-konfigurationer i pom.xml.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Konvertera HTML till DOCX/DOC/DOCM i Java

Med Aspose.Words för Java kan konverteringen av en HTML-fil till Word-format göras i ett par steg, som nämns nedan.

Metoden SaveFormat enum i Document.save() anger i vilket format du vill konvertera HTML-filen. Följande kodexempel visar hur man genererar ett Word-dokument från HTML i Java.

// Ladda HTML-fil med Document class
Document document = new Document("template.html");

// Konvertera HTML-fil till Word DOCX-format
document.save("output.docx", SaveFormat.DOCX); 

Konvertera en webbsida till Word med URL i Java

Du kan också konvertera en webbsida till ett Word-dokument direkt från dess URL. Följande är stegen för att konvertera HTML till DOCX med URL i Java.

Följande kodexempel visar hur man konverterar en webbsida till ett Word-dokument med hjälp av en URL.

// Skapa och initiera URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// Få webbsida som indataström
InputStream is = oracleURL.openStream();

// Initiera HTML-laddningsalternativ
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// Ladda ström till dokumentobjekt
Document doc = new Document(is, htmloptions);

// Spara som DOCX
doc.save("output.docx", SaveFormat.DOCX);

Konvertera en HTML-sträng till Word med Java

Aspose.Words för Java låter dig också generera ett Word-dokument från HTML-sträng dynamiskt. Följande är stegen för att utföra denna operation.

Följande kodexempel visar hur man konverterar en HTML-sträng till en DOCX-fil med Java.

// Skapa ett nytt dokument
Document doc = new Document();

// Skapa en dokumentbyggare
DocumentBuilder builder = new DocumentBuilder(doc);

// Infoga HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// Spara som DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

Skaffa en gratis API-licens

Du kan använda Aspose.Words för Java utan utvärderingsbegränsningar genom att få en gratis tillfällig licens.

Slutsats

I den här artikeln har du lärt dig hur du konverterar HTML-filer till Word DOCX, DOC, DOCM eller andra format programmatiskt med Java. Dessutom har du sett hur man konverterar en HTML-sträng eller en webbsida från en URL till ett Word-dokument dynamiskt. Du kan helt enkelt installera Aspose.Words för Java och använda den medföljande koden för att bygga din HTML till Word-konverterare. Dessutom kan du besöka dokumentationen för att utforska mer om Aspose.Words för Java. Dessutom kan du dela dina frågor med oss på vårt forum.

Se även

Info: Om du någonsin behöver få ett Word-dokument från en PowerPoint-presentation kan du använda Aspose Presentation to Word Document-konverteraren.