Word vers HTML Java

Afin d’intégrer le contenu des documents Word dans vos applications, vous devrez peut-être effectuer la conversion. Les conversions les plus largement choisies dans de tels cas sont Word vers HTML ou Word vers image. Conformément à cela, cet article explique comment convertir des fichiers Word DOCX ou DOC en HTML à l’aide de Java. Nous verrons également comment conserver les fichiers de ressources dans un dossier séparé.

API Java pour la conversion de Word en HTML

Pour la conversion DOCX/DOC en HTML, nous utiliserons Aspose.Words for Java. Il s’agit d’une API puissante pour implémenter des fonctionnalités de traitement de texte à partir des applications Java. De plus, l’API permet une conversion haute fidélité des documents Word en HTML et autres formats. Vous pouvez soit télécharger l’API ou l’installer depuis Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.10</version>
    <type>pom</type>
</dependency>

Convertir un document Word en HTML en Java

Pour convertir un document Word en HTML, il vous suffit de charger le document et de l’enregistrer en tant que fichier HTML. Voici les étapes pour convertir un fichier Word DOCX en HTML à l’aide de Java.

L’exemple de code suivant montre comment convertir un document Word en HTML à l’aide de Java.

// Charger le document à partir du disque
Document doc = new Document("document.docx");

// Enregistrez le document au format HTML
doc.save("Document_out.html", SaveFormat.HTML);

Spécifier le dossier de ressources dans la conversion Word en HTML

Vous pouvez également configurer l’API pour enregistrer les fichiers de ressources dans un dossier séparé. De plus, vous pouvez conserver les polices et les images séparément dans différents dossiers. Voici les étapes pour spécifier le dossier de ressources.

L’exemple de code suivant conserve les fichiers de ressources dans un dossier séparé lors de la conversion Word vers HTML.

// Charger le document
Document doc = new Document("Document.docx");

// Spécifier le dossier de ressources
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");

// Convertir un document Word en HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);

Vous pouvez en savoir plus sur l’utilisation des dossiers de ressources dans la conversion Word vers HTML.

Obtenez une licence API gratuite

Vous pouvez utiliser Aspose.Words for Java sans limitation d’évaluation en obtenant une licence temporaire gratuite.

Conclusion

Dans cet article, vous avez appris à convertir des fichiers Word DOCX ou DOC en HTML par programmation à l’aide de Java. En plus de cela, vous avez vu comment stocker les fichiers de ressources séparément dans la conversion Word vers HTML. En outre, vous pouvez en savoir plus sur Aspose.Words for Java en utilisant la documentation. De plus, vous pouvez partager vos questions avec nous sur notre forum.

Voir également