I olika fall kan du behöva konvertera HTML-innehållet till ett Word-dokument. Till exempel för att generera dokumentet från en WYSIWYG HTML-redigerare eller konvertera en webbsida till DOCX- eller DOC-format. För att utföra denna konvertering programmatiskt beskriver den här artikeln hur du konverterar HTML-filer till Word DOCX, DOC, DOCM eller andra format i Java.
- Bibliotek för att konvertera HTML till Word
- Konvertera en HTML-fil till DOCX/DOC/DOCM etc.
- Konvertera en webbsida till Word med hjälp av URL
- HTML-sträng till Word-konvertering
Java-bibliotek för att konvertera HTML till Word
För att konvertera HTML till DOCX, DOC, DOT, DOCM och andra Word-format kommer vi att använda Aspose.Words for Java. Det är ett kraftfullt bibliotek för att skapa och manipulera Word-dokument programmatiskt. Dessutom tillhandahåller den en inbyggd dokumentomvandlare som ger högtroget konvertering av/till ordbehandlingsdokument. Du kan ladda ner API:s JAR från nedladdningssektionen eller installera den med hjälp av följande Maven-konfigurationer i pom.xml.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Konvertera HTML till DOCX/DOC/DOCM i Java
Med Aspose.Words för Java kan konverteringen av en HTML-fil till Word-format göras i ett par steg, som nämns nedan.
- Ladda HTML-filen med klassen Document.
- Spara HTML-filen som Word-dokument med metoden Document.save(string, SaveFormat).
Metoden SaveFormat enum i Document.save() anger i vilket format du vill konvertera HTML-filen. Följande kodexempel visar hur man genererar ett Word-dokument från HTML i Java.
// Ladda HTML-fil med Document class
Document document = new Document("template.html");
// Konvertera HTML-fil till Word DOCX-format
document.save("output.docx", SaveFormat.DOCX);
Konvertera en webbsida till Word med URL i Java
Du kan också konvertera en webbsida till ett Word-dokument direkt från dess URL. Följande är stegen för att konvertera HTML till DOCX med URL i Java.
- Skapa en instans av klassen URL och initiera den med önskad URL.
- Öppna URL i ett InputStream objekt.
- Skapa en instans av klassen HtmlLoadOptions.
- Skapa en instans av klassen Document och initiera den med InputStream- och HtmlLoadOptions-objekt.
- Spara webbsidan som Word-dokument med metoden Document.save(string, SaveFormat).
Följande kodexempel visar hur man konverterar en webbsida till ett Word-dokument med hjälp av en URL.
// Skapa och initiera URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");
// Få webbsida som indataström
InputStream is = oracleURL.openStream();
// Initiera HTML-laddningsalternativ
HtmlLoadOptions htmloptions = new HtmlLoadOptions();
// Ladda ström till dokumentobjekt
Document doc = new Document(is, htmloptions);
// Spara som DOCX
doc.save("output.docx", SaveFormat.DOCX);
Konvertera en HTML-sträng till Word med Java
Aspose.Words för Java låter dig också generera ett Word-dokument från HTML-sträng dynamiskt. Följande är stegen för att utföra denna operation.
- Skapa en instans av klassen Document.
- Skapa en instans av klassen DocumentBuilder och initiera den med Document-objekt.
- Infoga HTML i dokumentet med metoden DocumentBuilder.InsertHtml(string).
- Spara Word-dokumentet med metoden Document.save(string, SaveFormat).
Följande kodexempel visar hur man konverterar en HTML-sträng till en DOCX-fil med Java.
// Skapa ett nytt dokument
Document doc = new Document();
// Skapa en dokumentbyggare
DocumentBuilder builder = new DocumentBuilder(doc);
// Infoga HTML
builder.insertHtml("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>");
// Spara som DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);
Skaffa en gratis API-licens
Du kan använda Aspose.Words för Java utan utvärderingsbegränsningar genom att få en gratis tillfällig licens.
Slutsats
I den här artikeln har du lärt dig hur du konverterar HTML-filer till Word DOCX, DOC, DOCM eller andra format programmatiskt med Java. Dessutom har du sett hur man konverterar en HTML-sträng eller en webbsida från en URL till ett Word-dokument dynamiskt. Du kan helt enkelt installera Aspose.Words för Java och använda den medföljande koden för att bygga din HTML till Word-konverterare. Dessutom kan du besöka dokumentationen för att utforska mer om Aspose.Words för Java. Dessutom kan du dela dina frågor med oss på vårt forum.
Se även
- Skapa Word-dokument utan MS Office med Java
- Konvertera PDF till Word i Java
- Konvertera Word till PDF i Java
Info: Om du någonsin behöver få ett Word-dokument från en PowerPoint-presentation kan du använda Aspose Presentation to Word Document-konverteraren.