Converti file HTML in Word DOCX DOC in Java

In vari casi, potrebbe essere necessario convertire il contenuto HTML in un documento Word. Ad esempio, per generare il documento da un editor HTML WYSIWYG o convertire una pagina Web in formato DOCX o DOC. Per eseguire questa conversione a livello di codice, questo articolo illustra come convertire i file HTML in Word DOCX, DOC, DOCM o altri formati in Java.

Libreria Java per convertire HTML in Word

Per convertire HTML in DOCX, DOC, DOT, DOCM e altri formati Word, utilizzeremo Aspose.Words for Java. È una potente libreria per creare e manipolare documenti di Word a livello di codice. Inoltre, fornisce un convertitore di documenti integrato che fornisce la conversione ad alta fedeltà di/in documenti di elaborazione testi. Puoi scaricare il JAR dell’API dalla sezione download o installarlo utilizzando le seguenti configurazioni Maven in pom.xml.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Converti HTML in DOCX/DOC/DOCM in Java

Utilizzando Aspose.Words per Java, la conversione di un file HTML in formato Word può essere eseguita in un paio di passaggi, menzionati di seguito.

Il metodo enum SaveFormat nel metodo Document.save() specifica il formato in cui si desidera convertire il file HTML. L’esempio di codice seguente mostra come generare un documento Word da HTML in Java.

// Carica il file HTML utilizzando la classe Document
Document document = new Document("template.html");

// Converti file HTML in formato Word DOCX
document.save("output.docx", SaveFormat.DOCX); 

Converti una pagina Web in Word utilizzando l’URL in Java

Puoi anche convertire una pagina web in un documento Word direttamente dal suo URL. Di seguito sono riportati i passaggi per convertire HTML in DOCX utilizzando l’URL in Java.

  • Crea un’istanza della classe URL e inizializzala con l’URL desiderato.
  • Apri l’URL in un oggetto InputStream.
  • Crea un’istanza della classe HtmlLoadOptions.
  • Crea un’istanza della classe Document e inizializzala con gli oggetti InputStream e HtmlLoadOptions.
  • Salva la pagina web come documento Word usando il metodo Document.save(string, SaveFormat).

L’esempio di codice seguente mostra come convertire una pagina Web in un documento di Word usando un URL.

// Crea e inizializza l'URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// Ottieni la pagina web come flusso di input
InputStream is = oracleURL.openStream();

// Inizializza le opzioni di caricamento HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// Carica il flusso nell'oggetto Document
Document doc = new Document(is, htmloptions);

// Salva come DOCX
doc.save("output.docx", SaveFormat.DOCX);

Converti una stringa HTML in Word usando Java

Aspose.Words per Java consente anche di generare un documento Word da una stringa HTML in modo dinamico. Di seguito sono riportati i passaggi per eseguire questa operazione.

L’esempio di codice seguente mostra come convertire una stringa HTML in un file DOCX utilizzando Java.

// Crea un nuovo documento
Document doc = new Document();

// Crea un generatore di documenti
DocumentBuilder builder = new DocumentBuilder(doc);

// Inserisci HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// Salva come DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

Ottieni una licenza API gratuita

Puoi utilizzare Aspose.Words per Java senza limitazioni di valutazione ottenendo una licenza temporanea.

Conclusione

In questo articolo, hai imparato come convertire i file HTML in Word DOCX, DOC, DOCM o altri formati a livello di codice utilizzando Java. Inoltre, hai visto come convertire dinamicamente una stringa HTML o una pagina Web da un URL a un documento Word. Puoi semplicemente installare Aspose.Words per Java e utilizzare il codice fornito per creare il tuo convertitore da HTML a Word. Inoltre, puoi visitare la documentazione per saperne di più su Aspose.Words per Java. Inoltre, puoi condividere le tue domande con noi sul nostro forum.

Guarda anche

Informazioni: se hai bisogno di ottenere un documento Word da una presentazione PowerPoint, puoi utilizzare il convertitore Aspose Presentazione in documento Word.