Dans divers cas, vous devrez peut-être convertir le contenu HTML en un document Word. Par exemple, pour générer le document à partir d’un éditeur HTML WYSIWYG ou pour convertir une page Web au format DOCX ou DOC. Pour effectuer cette conversion par programmation, cet article explique comment convertir des fichiers HTML en Word DOCX, DOC, DOCM ou d’autres formats en Java.
- Bibliothèque pour convertir HTML en Word
- Convertir un fichier HTML en DOCX/DOC/DOCM etc.
- Convertir une page Web en Word à l’aide d’une URL
- Conversion de chaîne HTML en mot
Bibliothèque Java pour convertir HTML en Word
Pour convertir HTML en DOCX, DOC, DOT, DOCM et autres formats Word, nous utiliserons Aspose.Words for Java. C’est une bibliothèque puissante pour créer et manipuler des documents Word par programmation. De plus, il fournit un convertisseur de document intégré qui permet une conversion haute fidélité de/vers des documents de traitement de texte. Vous pouvez télécharger le JAR de l’API à partir de la section téléchargements ou l’installer à l’aide des configurations Maven suivantes dans pom.xml.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Convertir HTML en DOCX/DOC/DOCM en Java
En utilisant Aspose.Words for Java, la conversion d’un fichier HTML au format Word peut être effectuée en quelques étapes, qui sont mentionnées ci-dessous.
- Chargez le fichier HTML à l’aide de la classe Document.
- Enregistrez le fichier HTML en tant que document Word à l’aide de la méthode Document.save(string, SaveFormat).
L’énumération SaveFormat dans la méthode Document.save() spécifie le format dans lequel vous souhaitez convertir le fichier HTML. L’exemple de code suivant montre comment générer un document Word à partir de HTML en Java.
// Charger le fichier HTML à l'aide de la classe Document
Document document = new Document("template.html");
// Convertir le fichier HTML au format Word DOCX
document.save("output.docx", SaveFormat.DOCX);
Convertir une page Web en Word à l’aide d’une URL en Java
Vous pouvez également convertir une page Web en document Word directement à partir de son URL. Voici les étapes pour convertir HTML en DOCX en utilisant l’URL en Java.
- Créez une instance de la classe URL et initialisez-la avec l’URL souhaitée.
- Ouvrez l’URL dans un objet InputStream.
- Créez une instance de la classe HtmlLoadOptions.
- Créez une instance de la classe Document et initialisez-la avec les objets InputStream et HtmlLoadOptions.
- Enregistrez la page Web en tant que document Word à l’aide de la méthode Document.save(string, SaveFormat).
L’exemple de code suivant montre comment convertir une page Web en document Word à l’aide d’une URL.
// Créer et initialiser l'URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");
// Obtenir la page Web comme flux d'entrée
InputStream is = oracleURL.openStream();
// Initialiser les options de chargement HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();
// Charger le flux dans l'objet Document
Document doc = new Document(is, htmloptions);
// Enregistrer au format DOCX
doc.save("output.docx", SaveFormat.DOCX);
Convertir une chaîne HTML en Word à l’aide de Java
Aspose.Words for Java vous permet également de générer dynamiquement un document Word à partir d’une chaîne HTML. Voici les étapes pour effectuer cette opération.
- Créez une instance de la classe Document.
- Créez une instance de la classe DocumentBuilder et initialisez-la avec l’objet Document.
- Insérez du code HTML dans le document à l’aide de la méthode DocumentBuilder.InsertHtml(string).
- Enregistrez le document Word à l’aide de la méthode Document.save(string, SaveFormat).
L’exemple de code suivant montre comment convertir une chaîne HTML en un fichier DOCX à l’aide de Java.
// Créer un nouveau document
Document doc = new Document();
// Créer un générateur de documents
DocumentBuilder builder = new DocumentBuilder(doc);
// Insérer HTML
builder.insertHtml("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>");
// Enregistrer au format DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);
Obtenez une licence API gratuite
Vous pouvez utiliser Aspose.Words for Java sans limitation d’évaluation en obtenant une licence temporaire gratuite.
Conclusion
Dans cet article, vous avez appris à convertir des fichiers HTML en Word DOCX, DOC, DOCM ou d’autres formats par programmation à l’aide de Java. De plus, vous avez vu comment convertir dynamiquement une chaîne HTML ou une page Web d’une URL en un document Word. Vous pouvez simplement installer Aspose.Words for Java et utiliser le code fourni pour créer votre convertisseur HTML vers Word. En outre, vous pouvez visiter la documentation pour en savoir plus sur Aspose.Words for Java. De plus, vous pouvez partager vos questions avec nous sur notre forum.
Voir également
- Créer des documents Word sans MS Office en utilisant Java
- Convertir PDF en Word en Java
- Convertir Word en PDF en Java
Info : Si jamais vous avez besoin d’obtenir un document Word à partir d’une présentation PowerPoint, vous pouvez utiliser le convertisseur Aspose Presentation to Word Document.