Per incorporare il contenuto dei documenti Word nelle tue applicazioni, potrebbe essere necessario eseguire la conversione. Le conversioni più utilizzate in questi casi sono da Word a HTML o da Word a immagine. In base a ciò, questo articolo spiega come convertire i file Word DOCX o DOC in HTML utilizzando Java. Inoltre, discuteremo come mantenere i file di risorse in una cartella separata.
- API Java per la conversione da Word a HTML
- Converti un documento Word in HTML
- Specifica la cartella delle risorse nella conversione da Word a HTML
API Java per la conversione da Word a HTML
Per la conversione da DOCX/DOC a HTML, utilizzeremo Aspose.Words for Java. È una potente API per implementare funzionalità di elaborazione testi dall’interno delle applicazioni Java. Inoltre, l’API fornisce la conversione ad alta fedeltà di documenti Word in HTML e altri formati. Puoi scaricare l’API o installarla da Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.10</version>
<type>pom</type>
</dependency>
Converti un documento Word in HTML in Java
Per convertire un documento Word in HTML, devi solo caricare il documento e salvarlo come file HTML. Di seguito sono riportati i passaggi per convertire un file Word DOCX in HTML utilizzando Java.
- Carica il documento di Word usando la classe Document.
- Converti il documento Word in HTML usando il metodo Document.save(string, SaveFormat).
L’esempio di codice seguente mostra come convertire un documento Word in HTML utilizzando Java.
// Carica il documento dal disco
Document doc = new Document("document.docx");
// Salva il documento come HTML
doc.save("Document_out.html", SaveFormat.HTML);
Specifica la cartella delle risorse nella conversione da Word a HTML
Puoi anche configurare l’API per salvare i file di risorse in una cartella separata. Inoltre, puoi mantenere i caratteri e le immagini separatamente in cartelle diverse. Di seguito sono riportati i passaggi per specificare la cartella delle risorse.
- Carica il documento di Word usando la classe Document.
- Crea un oggetto della classe HtmlSaveOptions.
- Imposta la cartella delle risorse usando il metodo HtmlSaveOptions.setResourceFolder.
- Converti il documento Word in HTML usando il metodo Document.save(string, HtmlSaveOptions).
L’esempio di codice seguente conserva i file di risorse in una cartella separata nella conversione da Word a HTML.
// Carica documento
Document doc = new Document("Document.docx");
// Specifica la cartella delle risorse
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");
// Converti documento Word in HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);
Puoi leggi di più sull’utilizzo delle cartelle di risorse nella conversione da Word a HTML.
Ottieni una licenza API gratuita
Puoi utilizzare Aspose.Words per Java senza limitazioni di valutazione ottenendo una licenza temporanea.
Conclusione
In questo articolo, hai imparato come convertire i file Word DOCX o DOC in HTML a livello di codice utilizzando Java. Oltre a questo, hai visto come archiviare i file di risorse separatamente nella conversione da Word a HTML. Inoltre, puoi leggere di più su Aspose.Words per Java usando la documentazione. Inoltre, puoi condividere le tue domande con noi sul nostro forum.