PDF a XLS en C# .NET

La conversión de archivos PDF a formato Excel se vuelve esencial cuando necesita exportar los datos tabulares de documentos PDF a hojas de cálculo. Como programador, a menudo obtiene los datos tabulares en formato PDF y para procesar esos datos, debe convertirlos a formato Excel. Entonces, echemos un vistazo a cómo hacerlo mediante programación desde aplicaciones .NET. Después de leer este artículo, podrá convertir un PDF a Excel XLS o XLSX en C# .NET.

Este artículo cubre las siguientes conversiones de PDF a Excel.

Convertidor de PDF a Excel de C# .NET - Descarga gratuita

Para convertir un archivo PDF a Excel XLS/XLS en C#, usaremos Aspose.PDF for .NET. La API admite la creación y manipulación de documentos PDF, así como la conversión de archivos PDF a otros formatos con alta fidelidad. Puede descargar su archivo DLL o instalarlo desde NuGet mediante una de las siguientes formas.

Conversor de PDF a Excel - Instalación a través de NuGet Package Manager

  • Abra/cree el proyecto en Visual Studio.
  • Vaya al Administrador de paquetes NuGet y busque Aspose.PDF.
  • Instale la API.

Instalar a través de la consola del administrador de paquetes

PM> Install-Package Aspose.PDF

Convertir un PDF a Excel XLS en C#

Para convertir un documento PDF a la hoja de cálculo XLS, simplemente puede cargar el archivo PDF y guardarlo con la extensión “.xls”. Los siguientes son los pasos para realizar esta conversión.

  • Cargue el archivo PDF utilizando la clase Document.
  • Cree un objeto de la clase ExcelSaveOptions.
  • Guarde el archivo PDF como Excel XLS usando el método Document.Save(string, ExcelSaveOptions).

El siguiente ejemplo de código muestra cómo convertir PDF a Excel XLS en C#.

// Cargar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions(); 
// Guardar archivo de salida
pdfDocument.Save("Excel.xls", options);

Introducir documento PDF

Excel XLS convertido

Convertir PDF a XLSX en C#

De forma predeterminada, Aspose.PDF convierte el documento PDF a formato XLS. En caso de que desee obtener la hoja de cálculo de Excel convertida en formato XLSX, puede especificarla usando la clase ExcelSaveOptions.

El siguiente ejemplo de código muestra cómo convertir un documento PDF a Excel con formato XLSX usando C#.

// Cargar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inicializar ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Establecer formato de salida
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Guardar archivo de salida
pdfDocument.Save("Excel.xlsx", options);

C# Exportar PDF a Excel - Primera columna en blanco

También puede insertar una primera columna en blanco en la hoja de cálculo de Excel convertida. Esto se puede hacer usando la opción ExcelSaveOptions.InsertBlankColumnAtFirst.

  • Cargue el archivo PDF utilizando la clase Document.
  • Cree un objeto de la clase ExcelSaveOptions.
  • (Opcional) Establezca el formato de salida de Excel en XLSX mediante la propiedad ExcelSaveOptions.Format.
  • Establezca la propiedad ExcelSaveOptions.InsertBlankColumnAtFirst en verdadero.
  • Guarde el archivo PDF en formato Excel usando el método Document.Save(string, ExcelSaveOptions).

El siguiente ejemplo de código muestra cómo agregar una primera columna en blanco en la conversión de PDF a Excel.

// Cargar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inicializar ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Establecer formato de salida
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Para insertar una columna en blanco como primera columna de la hoja de trabajo 
options.InsertBlankColumnAtFirst = true;
// Guardar archivo de salida
pdfDocument.Save("Excel.xlsx", options);

Guardar PDF como XLS en C# - Número de hojas minimizado

De forma predeterminada, cada página del documento PDF de entrada se convierte en una hoja de trabajo independiente. Para los documentos PDF grandes con varias páginas, la hoja de cálculo de Excel convertida también contendrá varias hojas de trabajo. En tal caso, puede personalizar la conversión de PDF a Excel y minimizar la cantidad de hojas de trabajo en la hoja de cálculo convertida. Los siguientes son los pasos para realizar esta personalización.

  • Cargue el archivo PDF utilizando la clase Document.
  • Cree un objeto de la clase ExcelSaveOptions.
  • (Opcional) Establezca el formato de salida de Excel en XLSX mediante la propiedad ExcelSaveOptions.Format.
  • Establezca la propiedad ExcelSaveOptions.MinimizeTheNumberOfWorksheets en verdadero.
  • Guarde el archivo PDF como XLS/XLSX usando el método Document.Save(string, ExcelSaveOptions).

El siguiente ejemplo de código muestra cómo minimizar la cantidad de hojas de cálculo en la conversión de PDF a Excel en C#.

// Cargar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inicializar ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Establecer formato de salida
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Minimizar el número de hojas de trabajo
options.MinimizeTheNumberOfWorksheets = true;
// Guardar archivo de salida
pdfDocument.Save("Excel.xlsx", options);

Biblioteca de conversión de PDF a Excel C#: obtenga una licencia gratuita

Puede [obtener una licencia temporal gratuita][17] para convertir archivos PDF a formato Excel sin limitaciones de evaluación.

Lee mas

En caso de que esté interesado en explorar otras características de Aspose.PDF, visite la documentación aquí.

Conclusión

En este artículo, ha aprendido cómo convertir archivos PDF a formatos de Excel mediante programación en C#. Además, has visto cómo personalizar la conversión utilizando diferentes opciones. Puede integrar fácilmente el ejemplo de código proporcionado en sus aplicaciones .NET.

Artículos relacionados

Documentos PDF a Excel XLS/XLSX usando JavaConversión de documentos de Word a PDF mediante programación en C# .NETArchivo PDF a texto en Python
XLSX a JSON en JavaExcel a JSON en JavaDOCX a JSON en Java
DOC a JSON en JavaPalabra a JSON en JavaTXT a JSON en Java
JSON a PDF en PythonExcel a JSON en JavaTXT a JSON en Python
Convertir documentos de Word a Markdown usando C#Convertir documentos de Word a Markdown usando JavaConvertir documentos de Word a TIFF en Python
Convertir Word a HTML en PythonConvertir Word a HTML usando C#Convertir Word a HTML usando Java
Convertir Word a Markdown en Python