PDF à Word

PDF est l’un des formats les plus couramment utilisés pour envoyer le document à des tiers. La raison de cette popularité est la compatibilité de PDF sur plusieurs plates-formes, quelles que soient les exigences matérielles/logicielles. Cependant, dans certains cas, vous souhaiterez convertir le document PDF en un format de document modifiable. Le format PDF vers DOC ou DOCX pourrait être l’option de conversion prioritaire dans de tels cas. Afin d’automatiser le processus de conversion, cet article explique comment convertir des PDF en Word DOC et DOCX par programme en Java.

Ainsi, dans cet article, vous apprendrez à :

  • Convertir PDF en DOC en utilisant Java.
  • Convertissez le format PDF au format DOCX en utilisant Java.
  • Personnalisez la conversion PDF vers Word (DOC/DOCX).

Bibliothèque de conversion Java PDF vers Word DOC

Grâce à Aspose.PDF for Java - une API Java de manipulation de PDF qui fournit des moyens simples de convertir des fichiers PDF en une variété d’autres formats, y compris PDF en DOC et PDF en DOCX. Vous pouvez télécharger et ajouter le fichier JAR de l’API à votre projet ou le référencer à l’aide des configurations Maven suivantes :

Repository:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Dependency:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>19.12</version>
</dependency>

Convertir PDF en DOC en Java

Une fois que vous avez référencé Aspose.PDF for Java dans votre application, vous pouvez convertir n’importe quel document PDF au format DOC en quelques lignes de code. Voici les étapes requises pour effectuer cette conversion.

  • Créez une instance de la classe Document et initialisez-la avec le chemin du fichier PDF d’entrée.
  • Appelez la méthode Document.save() avec le nom du fichier DOC de sortie et les arguments SaveFormat.Doc.

L’exemple de code suivant montre comment convertir un PDF en DOC en Java.

// Charger le fichier PDF source
Document doc = new Document("input.pdf");

// Enregistrer le fichier DOC résultant
doc.save("output.doc", SaveFormat.Doc);

Saisir un document PDF

Comment convertir un PDF en DOC en Java

Document Word de sortie

Convertir PDF en DOCX en Java

Convertir PDF en DOCX en Java

DOCX est un format bien connu pour les documents Word et contrairement au format DOC, la structure de DOCX était basée sur les fichiers binaires ainsi que sur les fichiers XML. Si vous souhaitez convertir un PDF au format DOCX, vous pouvez demander à l’API de le faire en utilisant l’argument SaveFormat.DocX dans la méthode Document.save().

L’exemple de code suivant montre comment convertir un PDF en DOCX en Java.

// Charger le fichier PDF source
Document doc = new Document("input.pdf");

// Enregistrer le fichier DOCX résultant
doc.save("output.docx", SaveFormat.DocX);

Java PDF vers Word avec des options supplémentaires

Aspose.PDF for Java fournit également des options supplémentaires que vous pouvez utiliser dans la conversion PDF vers Word, telles que le format de sortie, la résolution de l’image, la distance entre les lignes de texte, etc. La classe DocSaveOptions est utilisée à cette fin et voici la liste des options que vous pouvez utiliser :

L’exemple de code suivant montre comment utiliser la classe DocSaveOptions dans la conversion PDF vers DOCX à l’aide de Java.

// Charger le fichier PDF source
Document doc = new Document("input.pdf");

// Instancier l'instance DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();

// Définir le format de sortie
saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);

// Définissez le mode de reconnaissance sur Flow
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);

// Définissez la proximité horizontale sur 2,5
saveOptions.setRelativeHorizontalProximity(2.5f);

// Activer la reconnaissance des puces pendant le processus de conversion
saveOptions.setRecognizeBullets(true);

// Enregistrer le fichier DOCX résultant
doc.save("resultant.docx", saveOptions);

Conclusion

Dans cet article, vous avez appris à quel point il est facile de convertir des documents PDF en Word DOC et DOCX en Java. Vous pouvez soit convertir PDF en DOC ou PDF en DOCX en fonction de vos besoins. De plus, des fonctionnalités supplémentaires pour personnaliser la conversion PDF vers Word DOC/DOCX ont également été discutées. Vous pouvez en savoir plus sur la conversion de PDF vers d’autres formats à partir de la documentation.

Articles Liés