Word in HTML Java

Per incorporare il contenuto dei documenti Word nelle tue applicazioni, potrebbe essere necessario eseguire la conversione. Le conversioni più utilizzate in questi casi sono da Word a HTML o da Word a immagine. In base a ciò, questo articolo spiega come convertire i file Word DOCX o DOC in HTML utilizzando Java. Inoltre, discuteremo come mantenere i file di risorse in una cartella separata.

API Java per la conversione da Word a HTML

Per la conversione da DOCX/DOC a HTML, utilizzeremo Aspose.Words for Java. È una potente API per implementare funzionalità di elaborazione testi dall’interno delle applicazioni Java. Inoltre, l’API fornisce la conversione ad alta fedeltà di documenti Word in HTML e altri formati. Puoi scaricare l’API o installarla da Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.10</version>
    <type>pom</type>
</dependency>

Converti un documento Word in HTML in Java

Per convertire un documento Word in HTML, devi solo caricare il documento e salvarlo come file HTML. Di seguito sono riportati i passaggi per convertire un file Word DOCX in HTML utilizzando Java.

L’esempio di codice seguente mostra come convertire un documento Word in HTML utilizzando Java.

// Carica il documento dal disco
Document doc = new Document("document.docx");

// Salva il documento come HTML
doc.save("Document_out.html", SaveFormat.HTML);

Specifica la cartella delle risorse nella conversione da Word a HTML

Puoi anche configurare l’API per salvare i file di risorse in una cartella separata. Inoltre, puoi mantenere i caratteri e le immagini separatamente in cartelle diverse. Di seguito sono riportati i passaggi per specificare la cartella delle risorse.

L’esempio di codice seguente conserva i file di risorse in una cartella separata nella conversione da Word a HTML.

// Carica documento
Document doc = new Document("Document.docx");

// Specifica la cartella delle risorse
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");

// Converti documento Word in HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);

Puoi leggi di più sull’utilizzo delle cartelle di risorse nella conversione da Word a HTML.

Ottieni una licenza API gratuita

Puoi utilizzare Aspose.Words per Java senza limitazioni di valutazione ottenendo una licenza temporanea.

Conclusione

In questo articolo, hai imparato come convertire i file Word DOCX o DOC in HTML a livello di codice utilizzando Java. Oltre a questo, hai visto come archiviare i file di risorse separatamente nella conversione da Word a HTML. Inoltre, puoi leggere di più su Aspose.Words per Java usando la documentazione. Inoltre, puoi condividere le tue domande con noi sul nostro forum.

Guarda anche