Convert PDF to Word

En este artículo, voy a demostrar cómo convertir documentos PDF a Word de manera precisa y sin esfuerzo, incluida la conversión de formatos PDF a DOC y PDF a DOCX. Las versiones anteriores de Microsoft Word guardaban documentos en formato binario con la extensión .doc. Con el lanzamiento de Office 2007, Microsoft adoptó Office Open XML (OOXML) que se basa en una combinación de archivos XML y binarios combinados como archivos ZIP. MS Word ahora usa .docx como la extensión predeterminada para guardar documentos.

La conversión de PDF a DOC y PDF a DOCX podría ser necesaria en varios escenarios. Por ejemplo, es posible que desee que el PDF sea editable o que desee evitar volver a escribir el contenido del PDF en un documento de Word manteniendo el formato original. Otro caso de uso podría ser la conversión masiva de PDF a DOC o DOCX sin ningún software especializado. Sin perder de vista tal escenario, este artículo cubre la siguiente conversión de PDF a Word mediante programación en C#:

  • Convertir PDF a DOC en C#
  • Convertir PDF a DOCX en C#
  • Convierta PDF a DOC con configuraciones adicionales

C# Convertidor de PDF a Word DOC o DOCX

Aspose.PDF for .NET posee una potente API de conversión de PDF a DOC o DOCX que le permite convertir documentos de PDF a Word en sus aplicaciones .NET con unas pocas líneas de código. La API se puede utilizar en WinForms, ASP.NET, servicios web o cualquier aplicación basada en .NET. Puede descargar la API o instalarla mediante el Administrador de paquetes NuGet en su proyecto.

Convertir PDF a DOC en C#

Los siguientes son los pasos para convertir PDF a DOC usando Aspose.PDF for .NET.

El siguiente ejemplo de código muestra cómo convertir PDF a Word DOC usando C#.

// Para obtener ejemplos completos y archivos de datos, vaya a https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// La ruta al directorio de documentos.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();          
            
// Abra el documento PDF de origen
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Guarde el archivo en formato de documento MS
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);

Convertir PDF a DOCX en C#

La conversión de PDF a DOCX es similar a la conversión de PDF a DOC, como se mostró anteriormente. La API tiene la clase DocSaveOptions que le permite establecer el formato del documento en DOCX. Los siguientes son los pasos para convertir PDF a DOCX:

  • Cargue los documentos PDF utilizando la clase Document.
  • Establezca el formato del documento de salida como DOCX usando la clase DocSaveOptions.
  • Guarde el documento con la extensión .docx utilizando el método Document.Save(string).

El siguiente ejemplo de código muestra cómo convertir un PDF a Word DOCX en C#.

// Para obtener ejemplos completos y archivos de datos, vaya a https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// La ruta al directorio de documentos.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Abra el documento PDF de origen
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Crear una instancia del objeto DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Especifique el formato de salida como DOCX
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// Guardar documento en formato docx
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);

Convierta PDF a DOC con opciones adicionales

Aspose.PDF for .NET ofrece otras opciones para personalizar la conversión de PDF a DOC o DOCX. La clase DocSaveOptions expone las propiedades para mejorar las conversiones de PDF a DOC, como la resolución de imagen, la distancia entre líneas, etc. El siguiente código muestra cómo establecer propiedades adicionales al convertir PDF a DOC en C# .

// Para obtener ejemplos completos y archivos de datos, vaya a https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// La ruta al directorio de documentos.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();           
          
// Abra el documento PDF de origen
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");            

// Guardar usando las opciones de guardado
// Crear objeto DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();

// Establecer el modo de reconocimiento como Flujo
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;

// Establezca la proximidad horizontal como 2.5
saveOptions.RelativeHorizontalProximity = 2.5f;

// Habilite el valor para reconocer viñetas durante el proceso de conversión
saveOptions.RecognizeBullets = true;

// Guarde el archivo DOC resultante
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);

Conclusión

En este artículo, ha aprendido algunas formas sencillas de convertir PDF a DOC y PDF a DOCX usando C#. Si desea obtener más información sobre las potentes funciones de conversión de Aspose.PDF for .NET, puede dirigirse a la sección de documentación de la API, Conversión de PDF a otros formatos. Descargue su copia gratuita de Aspose.PDF for .NET y podrá comenzar de inmediato siguiendo la documentación de la API. Si tiene alguna consulta, no dude en publicarla en el foro Aspose.PDF. Estaremos encantados de atenderle con sus dudas y consultas.

Ver también