De nos jours, le format Markdown (MD) est largement utilisé pour écrire des articles, des blogs et de la documentation en ligne. Cependant, sa syntaxe devient difficile à retenir et à écrire dans le cas de documents de grande taille. Pour faciliter les choses, vous pouvez écrire du contenu dans MS Word, puis convertir le fichier DOCX ou DOC en Markdown. Pour effectuer cette conversion par programmation, cet article explique comment convertir des documents Word en fichiers Markdown (.md) à l’aide de Java.
- Bibliothèque de conversion de Word en Markdown
- Convertir un document Word en Markdown
- Personnaliser la conversion de Word en Markdown
Bibliothèque de conversion Java Word en Markdown
Pour convertir les fichiers DOCX/DOC au format Markdown, nous utiliserons Aspose.Words for Java. Ladite API vous permet de créer et de manipuler des documents Word à partir d’applications Java. En outre, il fournit un convertisseur de documents de haute qualité pour convertir des documents MS Word vers d’autres formats. Vous pouvez télécharger le JAR de l’API ou l’installer à l’aide des configurations Maven suivantes.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Convertir un document Word en Markdown en Java
Voici les étapes pour convertir un fichier Word DOCX au format Markdown en Java.
- Chargez le fichier Word à l’aide de la classe Document.
- Convertissez le fichier Word au format Markdown à l’aide de la méthode Document.save(string).
L’exemple de code suivant montre comment convertir un fichier DOCX au format Markdown à l’aide de Java.
// Charger le document Word à partir du disque
Document doc = new Document("document.docx");
// Enregistrez le document au format Markdown
doc.save("word-to-markdown.md");
Personnaliser la conversion de Word en Markdown
Vous pouvez également modifier le comportement par défaut de l’API pour la conversion de Word en Markdown. Par exemple, vous pouvez définir l’alignement du contenu dans les tableaux, spécifier un dossier pour conserver les images, etc. Voici les étapes pour définir différentes options dans la conversion Word vers Markdown.
- Chargez le document Word à l’aide de la classe Document.
- Créez un objet de la classe MarkdownSaveOptions.
- Définissez les options souhaitées telles que MarkdownSaveOptions.setImagesFolder(string).
- Convertissez un document Word en Markdown à l’aide de la méthode Document.save(string, MarkdownSaveOptions).
L’exemple de code suivant montre comment personnaliser la conversion DOCX vers Markdown à l’aide de Java.
// Charger le document Word à partir du disque
Document doc = new Document("document.docx");
// Définir les options de démarquage
MarkdownSaveOptions so = new MarkdownSaveOptions();
so.setImagesFolder("D:\\Images");
// Enregistrez le document au format Markdown
doc.save("word-to-markdown.md", so);
Obtenez une licence API gratuite
Vous pouvez utiliser Aspose.Words for Java sans limitations d’évaluation à l’aide d’une licence temporaire.
Conclusion
Dans cet article, vous avez appris à convertir par programmation des fichiers Word DOCX/DOC en Markdown (.md) en Java. De plus, vous avez vu comment modifier la conversion de Word en Markdown en utilisant différentes options. Vous pouvez également explorer d’autres fonctionnalités offertes par Aspose.Words for Java en utilisant la documentation. De plus, n’hésitez pas à poser vos questions via notre forum.