Convertir Word en TXT en Java | DOCX vers TXT | Java mot en texte

Dans certains cas, nous pouvons avoir besoin d’exporter des données d’un format à un autre. Une exigence courante consiste à convertir des documents Word (DOC ou DOCX) en fichiers texte brut (TXT).Dans cet article, nous apprendrons comment convertir Word en TXT à l’aide de la bibliothèque Java Word to Text Converter.

Cet article couvre les sujets suivants :

Bibliothèque de conversion Java Word en texte

Aspose.Words for Java est une bibliothèque puissante pour les développeurs qui doivent travailler avec des documents dans leurs programmes Java. Il permet aux développeurs de créer, modifier et convertir des documents par programmation dans des applications Java. Vous pouvez le considérer comme un ensemble d’outils permettant de travailler avec des documents sans avoir besoin de Microsoft Word. Nous utiliserons cette bibliothèque pour convertir des documents Word en fichiers texte brut. En utilisant la bibliothèque Aspose.Words for Java, nous pouvons facilement convertir des fichiers DOC ou DOCX au format TXT, ce qui nous permet d’extraire le texte d’un document Word et de l’enregistrer sous forme de simple fichier texte.

Veuillez télécharger le JAR de l’API ou ajouter la configuration pom.xml suivante dans une application Java basée sur Maven.

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://releases.aspose.com/java/repo/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>24.3</version>
        <classifier>jdk17</classifier>
    </dependency>
<dependencies>

Étapes pour convertir Word DOC en TXT

Nous pouvons exporter du texte à partir de documents Word et l’enregistrer au format TXT en suivant les étapes simples ci-dessous :

  • Chargez le fichier Word DOC/DOCX.
  • Convertissez-le au format TXT.
  • Enregistrez le fichier à l’emplacement souhaité.

Nous n’avons pas besoin de traiter manuellement l’intégralité du document Word ligne par ligne ou page par page ; nous pouvons exploiter les bibliothèques Java pour extraire efficacement le contenu du texte. Voyons comment y parvenir en Java.

Convertir un Word DOC en TXT en Java

Nous pouvons facilement convertir un document Word (DOC ou DOCX) en fichier TXT en Java en suivant les étapes ci-dessous :

  • Tout d’abord, chargez le Word DOC/DOCX à l’aide de la classe Document.
  • Ensuite, enregistrez le document en tant que fichier TXT à l’aide de la méthode Document.save(filePath).

L’exemple de code suivant montre comment convertir un document Word au format TXT en Java.

// Cet exemple de code montre comment enregistrer un fichier DOCX au format TXT
// Charger le fichier Word
Document doc = new Document("D:\\Files\\document.docx");

// Enregistrer le document en tant que fichier TXT
doc.save("D:\\Files\\doc-to-text.txt");
Convertir un Word DOC en TXT en Java

Convertir un Word DOC en TXT en Java

Obtenez une licence gratuite

Vous pouvez obtenir une licence temporaire gratuite pour convertir des fichiers Word au format TXT sans limitations d’évaluation.

Convertir Word en TXT en ligne

Vous pouvez également utiliser ce convertisseur Word en texte gratuit pour convertir DOCX en TXT en ligne. Exportez votre contenu textuel à partir de documents Word vers un format de texte brut rapidement, avec une qualité et une précision élevées.

DOCX vers TXT – Ressources gratuites

En plus de convertir vos fichiers DOC ou DOCX au format TXT, libérez tout le potentiel d’Aspose.Words for Java. Explorez des fonctionnalités avancées telles que la création, la modification, la gestion ou la conversion de documents et bien plus encore à l’aide des ressources suivantes :

Conclusion

Dans cet article de blog, nous avons appris comment convertir Word en texte en extrayant le contenu textuel d’un document Word et en l’enregistrant sous forme de fichier texte brut. La conversion de Word en TXT en Java est une tâche simple qui peut être accomplie à l’aide de la bibliothèque Aspose.Words for Java. Ainsi, la prochaine fois que vous aurez besoin de convertir un document Word en texte brut, vous pourrez utiliser l’exemple de code fourni ci-dessus comme application de démarrage. En cas d’ambiguïté, n’hésitez pas à nous contacter sur notre forum d’assistance gratuit.

Voir également