PDF para XLS em C# .NET

A conversão de arquivos PDF para o formato Excel torna-se essencial quando você precisa exportar os dados tabulares de documentos PDF para planilhas. Como programador, você geralmente obtém os dados tabulares em formato PDF e, para processar esses dados, eles devem ser convertidos para o formato Excel. Então, vamos dar uma olhada em como fazer isso programaticamente a partir de aplicativos .NET. Depois de ler este artigo, você poderá converter um PDF para Excel XLS ou XLSX em C# .NET.

Este artigo aborda as seguintes conversões de PDF para Excel.

Conversor C# .NET PDF para Excel - Download Gratuito

Para converter arquivo PDF para Excel XLS/XLS em C#, usaremos Aspose.PDF for .NET. A API suporta a criação e manipulação de documentos PDF, bem como a conversão de arquivos PDF para outros formatos com alta fidelidade. Você pode baixar sua DLL ou instalá-la do NuGet usando uma das seguintes maneiras.

Conversor de PDF para Excel - Instalação via NuGet Package Manager

  • Abra/crie o projeto no Visual Studio.
  • Vá para NuGet Package Manager e pesquise Aspose.PDF.
  • Instale a API.

Instalar por meio do console do gerenciador de pacotes

PM> Install-Package Aspose.PDF

Converter um PDF para Excel XLS em C

Para converter um documento PDF em uma planilha XLS, basta carregar o arquivo PDF e salvá-lo com a extensão “.xls”. A seguir estão as etapas para realizar essa conversão.

  • Carregue o arquivo PDF usando a classe Document.
  • Crie um objeto da classe ExcelSaveOptions.
  • Salve o arquivo PDF como Excel XLS usando o método Document.Save(string, ExcelSaveOptions).

O exemplo de código a seguir mostra como converter PDF em Excel XLS em C#.

// Carregar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions(); 
// Salvar arquivo de saída
pdfDocument.Save("Excel.xls", options);

Documento PDF de Entrada

Excel XLS convertido

Converter PDF para XLSX em C#

Por padrão, o Aspose.PDF converte o documento PDF para o formato XLS. Caso você queira obter a planilha do Excel convertida no formato XLSX, você pode especificá-la usando a classe ExcelSaveOptions.

O exemplo de código a seguir mostra como converter um documento PDF em Excel com formato XLSX usando C#.

// Carregar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inicializar ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Definir formato de saída
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Salvar arquivo de saída
pdfDocument.Save("Excel.xlsx", options);

C # Exportar PDF para Excel - Primeira coluna em branco

Você também pode inserir uma primeira coluna em branco na planilha do Excel convertida. Isso pode ser feito usando a opção ExcelSaveOptions.InsertBlankColumnAtFirst.

  • Carregue o arquivo PDF usando a classe Document.
  • Crie um objeto da classe ExcelSaveOptions.
  • (Opcional) Defina o formato de saída do Excel como XLSX usando a propriedade ExcelSaveOptions.Format.
  • Defina a propriedade ExcelSaveOptions.InsertBlankColumnAtFirst como true.
  • Salve o arquivo PDF no formato Excel usando o método Document.Save(string, ExcelSaveOptions).

O exemplo de código a seguir mostra como adicionar uma primeira coluna em branco na conversão de PDF para Excel.

// Carregar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inicializar ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Definir formato de saída
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Para inserir coluna em branco como primeira coluna na planilha 
options.InsertBlankColumnAtFirst = true;
// Salvar arquivo de saída
pdfDocument.Save("Excel.xlsx", options);

Salvar PDF como XLS em C# - Número Minimizado de Folhas

Por padrão, todas as páginas do documento PDF de entrada são convertidas em uma planilha separada. Para documentos PDF grandes com várias páginas, a planilha do Excel convertida também conterá várias planilhas. Nesse caso, você pode personalizar a conversão de PDF para Excel e minimizar o número de planilhas na planilha convertida. A seguir estão as etapas para executar essa personalização.

  • Carregue o arquivo PDF usando a classe Document.
  • Crie um objeto da classe ExcelSaveOptions.
  • (Opcional) Defina o formato de saída do Excel como XLSX usando a propriedade ExcelSaveOptions.Format.
  • Defina a propriedade ExcelSaveOptions.MinimizeTheNumberOfWorksheets como true.
  • Salve o arquivo PDF como XLS/XLSX usando o método Document.Save(string, ExcelSaveOptions).

O exemplo de código a seguir mostra como minimizar o número de planilhas na conversão de PDF para Excel em C#.

// Carregar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inicializar ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Definir formato de saída
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Minimizar o número de planilhas
options.MinimizeTheNumberOfWorksheets = true;
// Salvar arquivo de saída
pdfDocument.Save("Excel.xlsx", options);

Biblioteca do conversor de PDF para Excel C# - obtenha uma licença gratuita

Você pode [obter uma licença temporária gratuita][17] para converter arquivos PDF para o formato Excel sem limitações de avaliação.

consulte Mais informação

Caso você esteja interessado em explorar outros recursos do Aspose.PDF, visite a documentação aqui.

Conclusão

Neste artigo, você aprendeu como converter arquivos PDF em formatos Excel programaticamente em C#. Além disso, você viu como personalizar a conversão usando diferentes opções. Você pode integrar facilmente o exemplo de código fornecido em seus aplicativos .NET.

Artigos relacionados

Documentos PDF para Excel XLS/XLSX usando JavaConvertendo documentos do Word para PDF programaticamente em C# .NETArquivo PDF para Texto em Python
XLSX para JSON em JavaExcel para JSON em JavaDOCX para JSON em Java
DOC para JSON em JavaWord para JSON em JavaTXT para JSON em Java
JSON para PDF em PythonExcel para JSON em JavaTXT para JSON em Python
Converter documentos do Word em Markdown usando C#Converter documentos do Word em Markdown usando JavaConverter documentos do Word para TIFF em Python
Converter Word para HTML em PythonConverter Word para HTML usando C#Converter Word para HTML usando Java
Converter Word para Markdown em Python