A conversão de arquivos PDF para o formato Excel torna-se essencial quando você precisa exportar os dados tabulares de documentos PDF para planilhas. Como programador, você geralmente obtém os dados tabulares em formato PDF e, para processar esses dados, eles devem ser convertidos para o formato Excel. Então, vamos dar uma olhada em como fazer isso programaticamente a partir de aplicativos .NET. Depois de ler este artigo, você poderá converter um PDF para Excel XLS ou XLSX em C# .NET.
Este artigo aborda as seguintes conversões de PDF para Excel.
- Conversor C# .NET PDF para Excel
- Converter um PDF para XLS em C #
- Converter um PDF para XLSX em C #
- Exportar PDF para Excel - Inserir primeira coluna em branco
- Salvar PDF como Excel XLS - Minimizar o número de folhas
Conversor C# .NET PDF para Excel - Download Gratuito
Para converter arquivo PDF para Excel XLS/XLS em C#, usaremos Aspose.PDF for .NET. A API suporta a criação e manipulação de documentos PDF, bem como a conversão de arquivos PDF para outros formatos com alta fidelidade. Você pode baixar sua DLL ou instalá-la do NuGet usando uma das seguintes maneiras.
Conversor de PDF para Excel - Instalação via NuGet Package Manager
- Abra/crie o projeto no Visual Studio.
- Vá para NuGet Package Manager e pesquise Aspose.PDF.
- Instale a API.
Instalar por meio do console do gerenciador de pacotes
PM> Install-Package Aspose.PDF
Converter um PDF para Excel XLS em C
Para converter um documento PDF em uma planilha XLS, basta carregar o arquivo PDF e salvá-lo com a extensão “.xls”. A seguir estão as etapas para realizar essa conversão.
- Carregue o arquivo PDF usando a classe Document.
- Crie um objeto da classe ExcelSaveOptions.
- Salve o arquivo PDF como Excel XLS usando o método Document.Save(string, ExcelSaveOptions).
O exemplo de código a seguir mostra como converter PDF em Excel XLS em C#.
// Carregar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions();
// Salvar arquivo de saída
pdfDocument.Save("Excel.xls", options);
Documento PDF de Entrada
Excel XLS convertido
Converter PDF para XLSX em C#
Por padrão, o Aspose.PDF converte o documento PDF para o formato XLS. Caso você queira obter a planilha do Excel convertida no formato XLSX, você pode especificá-la usando a classe ExcelSaveOptions.
O exemplo de código a seguir mostra como converter um documento PDF em Excel com formato XLSX usando C#.
// Carregar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inicializar ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Definir formato de saída
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Salvar arquivo de saída
pdfDocument.Save("Excel.xlsx", options);
C # Exportar PDF para Excel - Primeira coluna em branco
Você também pode inserir uma primeira coluna em branco na planilha do Excel convertida. Isso pode ser feito usando a opção ExcelSaveOptions.InsertBlankColumnAtFirst.
- Carregue o arquivo PDF usando a classe Document.
- Crie um objeto da classe ExcelSaveOptions.
- (Opcional) Defina o formato de saída do Excel como XLSX usando a propriedade ExcelSaveOptions.Format.
- Defina a propriedade ExcelSaveOptions.InsertBlankColumnAtFirst como true.
- Salve o arquivo PDF no formato Excel usando o método Document.Save(string, ExcelSaveOptions).
O exemplo de código a seguir mostra como adicionar uma primeira coluna em branco na conversão de PDF para Excel.
// Carregar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inicializar ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Definir formato de saída
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Para inserir coluna em branco como primeira coluna na planilha
options.InsertBlankColumnAtFirst = true;
// Salvar arquivo de saída
pdfDocument.Save("Excel.xlsx", options);
Salvar PDF como XLS em C# - Número Minimizado de Folhas
Por padrão, todas as páginas do documento PDF de entrada são convertidas em uma planilha separada. Para documentos PDF grandes com várias páginas, a planilha do Excel convertida também conterá várias planilhas. Nesse caso, você pode personalizar a conversão de PDF para Excel e minimizar o número de planilhas na planilha convertida. A seguir estão as etapas para executar essa personalização.
- Carregue o arquivo PDF usando a classe Document.
- Crie um objeto da classe ExcelSaveOptions.
- (Opcional) Defina o formato de saída do Excel como XLSX usando a propriedade ExcelSaveOptions.Format.
- Defina a propriedade ExcelSaveOptions.MinimizeTheNumberOfWorksheets como true.
- Salve o arquivo PDF como XLS/XLSX usando o método Document.Save(string, ExcelSaveOptions).
O exemplo de código a seguir mostra como minimizar o número de planilhas na conversão de PDF para Excel em C#.
// Carregar documento PDF
Document pdfDocument = new Document("sampletable.pdf");
// Inicializar ExcelSaveOptions
ExcelSaveOptions options = new ExcelSaveOptions();
// Definir formato de saída
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// Minimizar o número de planilhas
options.MinimizeTheNumberOfWorksheets = true;
// Salvar arquivo de saída
pdfDocument.Save("Excel.xlsx", options);
Biblioteca do conversor de PDF para Excel C# - obtenha uma licença gratuita
Você pode [obter uma licença temporária gratuita][17] para converter arquivos PDF para o formato Excel sem limitações de avaliação.
consulte Mais informação
Caso você esteja interessado em explorar outros recursos do Aspose.PDF, visite a documentação aqui.
Conclusão
Neste artigo, você aprendeu como converter arquivos PDF em formatos Excel programaticamente em C#. Além disso, você viu como personalizar a conversão usando diferentes opções. Você pode integrar facilmente o exemplo de código fornecido em seus aplicativos .NET.