För att bädda in innehållet i Word-dokument i dina applikationer kan du behöva utföra konverteringen. De vanligaste konverteringarna i sådana fall är Word till HTML eller en bild. Efter det tar den här artikeln upp hur du konverterar Word DOCX- eller DOC-filer till HTML med Java. Vi kommer också att diskutera hur man förvarar resursfiler i en separat mapp.
- Java API för Word till HTML-konvertering
- Konvertera ett Word-dokument till HTML
- Ange resursmapp i Word till HTML-konvertering
Java API för Word till HTML-konvertering
För DOCX DOC till HTML-konvertering kommer vi att använda Aspose.Words for Java. Den tillhandahåller gratis, högkvalitativ och höghastighetslösning för konvertering av Word till HTML. Du kan konvertera så många Word-dokument till HTML som du vill. Du kan antingen ladda ner API:et eller installera det från Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>22.10</version>
<type>pom</type>
</dependency>
Konvertera ett Word-dokument till HTML i Java
För att konvertera ett Word-dokument till HTML behöver du bara ladda dokumentet och spara det som en HTML-fil. Följande är stegen för att konvertera en Word DOCX-fil till HTML med Java.
- Ladda Word-dokumentet med klassen Document.
- Konvertera Word-dokument till HTML med metoden Document.save(string, SaveFormat).
Följande kodexempel visar hur man konverterar ett Word-dokument till HTML med Java.
// Ladda dokumentet från disken
Document doc = new Document("document.docx");
// Spara dokumentet som HTML
doc.save("Document_out.html", SaveFormat.HTML);
Ange resursmapp i Word till HTML-konvertering
Du kan också konfigurera API:et för att spara resursfilerna i en separat mapp. Dessutom kan du hålla teckensnitt och bilder separat i olika mappar. Följande är stegen för att ange resursmappen.
- Ladda Word-dokumentet med klassen Dokument.
- Skapa ett objekt av klassen HtmlSaveOptions.
- Ställ in resursmapp med metoden HtmlSaveOptions.setResourceFolder.
- Konvertera Word-dokument till HTML med metoden Document.save(string, HtmlSaveOptions).
Följande kodexempel håller resursfiler i en separat mapp i Word till HTML-konvertering.
// Ladda dokument
Document doc = new Document("Document.docx");
// Ange resursmapp
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");
// Konvertera Word-dokument till HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);
Du kan läs mer om att arbeta med resursmappar i Word till HTML-konvertering.
Gratis Word till HTML Converter
Du kan en gratis tillfällig licens och konvertera Word-dokument till HTML utan några begränsningar.
Slutsats
I den här artikeln har du lärt dig hur du konverterar Word DOCX- eller DOC-filer till HTML programmatiskt med Java. Utöver detta har du sett hur man lagrar resursfiler separat i Word till HTML-konvertering. Dessutom kan du läsa mer om Aspose.Words för Java med hjälp av dokumentationen. Dessutom kan du dela dina frågor med oss på vårt forum.