Convertir un PDF en Word

Dans cet article, je vais montrer comment convertir avec précision et sans effort un document PDF en document Word, y compris la conversion des formats PDF en DOC et PDF en DOCX. Les versions antérieures de Microsoft Word enregistraient les documents au format binaire avec l’extension .doc. Avec la sortie d’Office 2007, Microsoft a adopté Office Open XML (OOXML) qui est basé sur une combinaison de fichiers XML et binaires combinés sous forme d’archives ZIP. MS Word utilise désormais .docx comme extension par défaut pour enregistrer les documents.

La conversion de PDF en DOC et de PDF en DOCX peut être nécessaire dans divers scénarios. Par exemple, vous souhaiterez peut-être rendre le PDF modifiable ou éviter de retaper le contenu du PDF dans un document Word en conservant la mise en forme d’origine. Un autre cas d’utilisation pourrait être les conversions groupées de PDF en DOC ou DOCX sans aucun logiciel spécialisé. Gardant un œil sur un tel scénario, cet article couvre la conversion PDF vers Word suivante par programmation en C# :

  • Convertir PDF en DOC en C#
  • Convertir PDF en DOCX en C#
  • Convertir PDF en DOC avec des paramètres supplémentaires

Convertisseur C# PDF en Word DOC ou DOCX

Aspose.PDF for .NET possède une puissante API de conversion PDF en DOC ou DOCX qui vous permet de convertir des documents PDF en Word dans vos applications .NET en quelques lignes de code. L’API peut être utilisée dans WinForms, ASP.NET, les services Web ou toute application basée sur .NET. Vous pouvez soit télécharger l’API ou l’installer à l’aide du NuGet Package Manager dans votre projet.

Convertir PDF en DOC en C#

Voici les étapes pour convertir un PDF en DOC en utilisant Aspose.PDF for .NET.

  • Chargez les documents PDF à l’aide de la classe Document.
  • Enregistrez le document avec l’extension .doc en utilisant la méthode Document.Save(string).

L’exemple de code suivant montre comment convertir un PDF en Word DOC à l’aide de C#.

// Pour des exemples complets et des fichiers de données, rendez-vous sur https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Chemin d'accès au répertoire des documents.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();          
            
// Ouvrir le document PDF source
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Enregistrez le fichier au format de document MS
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);

Convertir PDF en DOCX en C#

La conversion de PDF en DOCX est similaire à la conversion de PDF en DOC, comme indiqué précédemment. L’API a la classe DocSaveOptions qui vous permet de définir le format du document sur DOCX. Voici les étapes pour convertir un PDF en DOCX :

  • Chargez les documents PDF à l’aide de la classe Document.
  • Définissez le format du document de sortie sur DOCX à l’aide de la classe DocSaveOptions.
  • Enregistrez le document avec l’extension .docx à l’aide de la méthode Document.Save(string).

L’exemple de code suivant montre comment convertir un PDF en Word DOCX en C#.

// Pour des exemples complets et des fichiers de données, rendez-vous sur https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Chemin d'accès au répertoire des documents.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Ouvrir le document PDF source
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Instancier l'objet DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Spécifiez le format de sortie en tant que DOCX
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// Enregistrer le document au format docx
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);

Convertir PDF en DOC avec des options supplémentaires

Aspose.PDF for .NET fournit diverses autres options pour personnaliser la conversion PDF en DOC ou DOCX. La classe DocSaveOptions expose les propriétés permettant d’améliorer ou d’améliorer les conversions PDF en DOC, telles que la résolution de l’image, la distance entre les lignes, etc. Le code suivant montre comment définir des propriétés supplémentaires lors de la conversion de PDF en DOC en C# .

// Pour des exemples complets et des fichiers de données, rendez-vous sur https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Chemin d'accès au répertoire des documents.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();           
          
// Ouvrir le document PDF source
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");            

// Enregistrer en utilisant les options d'enregistrement
// Créer un objet DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();

// Définissez le mode de reconnaissance sur Flow
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;

// Définissez la proximité horizontale sur 2,5
saveOptions.RelativeHorizontalProximity = 2.5f;

// Activer la valeur pour reconnaître les puces pendant le processus de conversion
saveOptions.RecognizeBullets = true;

// Enregistrez le fichier DOC résultant
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);

Conclusion

Dans cet article, vous avez appris quelques méthodes simples pour convertir un PDF en DOC et un PDF en DOCX à l’aide de C#. Si vous souhaitez en savoir plus sur les puissantes fonctionnalités de conversion d’Aspose.PDF for .NET, vous pouvez vous diriger vers la section de documentation de l’API, Conversion de PDF vers d’autres formats. Téléchargez votre copie gratuite de Aspose.PDF for .NET et vous pourrez commencer en un rien de temps en suivant la documentation de l’API. Si vous avez des questions, n’hésitez pas à poster sur forum Aspose.PDF. Nous serons heureux de vous aider avec vos questions et demandes de renseignements.

Voir également