In vari casi, potrebbe essere necessario convertire il contenuto HTML in un documento Word. Ad esempio, per generare il documento da un editor HTML WYSIWYG o convertire una pagina Web in formato DOCX o DOC. Per eseguire questa conversione a livello di codice, questo articolo illustra come convertire i file HTML in Word DOCX, DOC, DOCM o altri formati in Java.
- Libreria per convertire HTML in Word
- Converti un file HTML in DOCX/DOC/DOCM ecc.
- Converti una pagina Web in Word utilizzando l’URL
- Conversione da stringa HTML a Word
Libreria Java per convertire HTML in Word
Per convertire HTML in DOCX, DOC, DOT, DOCM e altri formati Word, utilizzeremo Aspose.Words for Java. È una potente libreria per creare e manipolare documenti di Word a livello di codice. Inoltre, fornisce un convertitore di documenti integrato che fornisce la conversione ad alta fedeltà di/in documenti di elaborazione testi. Puoi scaricare il JAR dell’API dalla sezione download o installarlo utilizzando le seguenti configurazioni Maven in pom.xml.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Converti HTML in DOCX/DOC/DOCM in Java
Utilizzando Aspose.Words per Java, la conversione di un file HTML in formato Word può essere eseguita in un paio di passaggi, menzionati di seguito.
- Carica il file HTML usando la classe Document.
- Salva il file HTML come documento Word usando il metodo Document.save(string, SaveFormat).
Il metodo enum SaveFormat nel metodo Document.save() specifica il formato in cui si desidera convertire il file HTML. L’esempio di codice seguente mostra come generare un documento Word da HTML in Java.
// Carica il file HTML utilizzando la classe Document
Document document = new Document("template.html");
// Converti file HTML in formato Word DOCX
document.save("output.docx", SaveFormat.DOCX);
Converti una pagina Web in Word utilizzando l’URL in Java
Puoi anche convertire una pagina web in un documento Word direttamente dal suo URL. Di seguito sono riportati i passaggi per convertire HTML in DOCX utilizzando l’URL in Java.
- Crea un’istanza della classe URL e inizializzala con l’URL desiderato.
- Apri l’URL in un oggetto InputStream.
- Crea un’istanza della classe HtmlLoadOptions.
- Crea un’istanza della classe Document e inizializzala con gli oggetti InputStream e HtmlLoadOptions.
- Salva la pagina web come documento Word usando il metodo Document.save(string, SaveFormat).
L’esempio di codice seguente mostra come convertire una pagina Web in un documento di Word usando un URL.
// Crea e inizializza l'URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");
// Ottieni la pagina web come flusso di input
InputStream is = oracleURL.openStream();
// Inizializza le opzioni di caricamento HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();
// Carica il flusso nell'oggetto Document
Document doc = new Document(is, htmloptions);
// Salva come DOCX
doc.save("output.docx", SaveFormat.DOCX);
Converti una stringa HTML in Word usando Java
Aspose.Words per Java consente anche di generare un documento Word da una stringa HTML in modo dinamico. Di seguito sono riportati i passaggi per eseguire questa operazione.
- Crea un’istanza della classe Document.
- Crea un’istanza della classe DocumentBuilder e inizializzala con l’oggetto Document.
- Inserisci HTML nel documento utilizzando il metodo DocumentBuilder.InsertHtml(string).
- Salva il documento di Word usando il metodo Document.save(string, SaveFormat).
L’esempio di codice seguente mostra come convertire una stringa HTML in un file DOCX utilizzando Java.
// Crea un nuovo documento
Document doc = new Document();
// Crea un generatore di documenti
DocumentBuilder builder = new DocumentBuilder(doc);
// Inserisci HTML
builder.insertHtml("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>");
// Salva come DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);
Ottieni una licenza API gratuita
Puoi utilizzare Aspose.Words per Java senza limitazioni di valutazione ottenendo una licenza temporanea.
Conclusione
In questo articolo, hai imparato come convertire i file HTML in Word DOCX, DOC, DOCM o altri formati a livello di codice utilizzando Java. Inoltre, hai visto come convertire dinamicamente una stringa HTML o una pagina Web da un URL a un documento Word. Puoi semplicemente installare Aspose.Words per Java e utilizzare il codice fornito per creare il tuo convertitore da HTML a Word. Inoltre, puoi visitare la documentazione per saperne di più su Aspose.Words per Java. Inoltre, puoi condividere le tue domande con noi sul nostro forum.
Guarda anche
- Crea documenti Word senza MS Office utilizzando Java
- Converti PDF in Word in Java
- Converti Word in PDF in Java
Informazioni: se hai bisogno di ottenere un documento Word da una presentazione PowerPoint, puoi utilizzare il convertitore Aspose Presentazione in documento Word.