Exclua linhas e colunas em branco no Excel usando Python

O Microsoft Excel é amplamente utilizado para organizar e gerenciar dados com eficiência. No entanto, lidar com linhas e colunas vazias em planilhas do Excel (XLS ou XLSX) pode ser uma tarefa tediosa e demorada. Linhas e colunas em branco muitas vezes podem ser resultado da importação de dados de várias fontes ou devido à entrada de dados incompleta. Independentemente do motivo, essas células vazias podem atrapalhar a precisão de nossa análise e aumentar o tamanho do arquivo. Nosso objetivo é identificar e excluir essas linhas e colunas rapidamente, economizando tempo e esforço. Podemos automatizar esse processo e agilizar nosso fluxo de trabalho de limpeza de dados programaticamente em Python. Neste artigo, exploraremos uma técnica poderosa para excluir linhas e colunas em branco no Excel usando Python.

Este artigo cobre os seguintes tópicos:

  1. API Python para excluir linhas e colunas em branco no Excel
  2. Excluir linhas em branco em uma planilha do Excel usando Python
  3. Excluir colunas em branco em uma planilha do Excel usando Python
  4. Atualizar referência ao excluir linhas e colunas em branco
  5. Recursos de aprendizagem gratuitos

Biblioteca Python para excluir linhas e colunas do Excel

Aspose.Cells é uma biblioteca popular para trabalhar com arquivos do Microsoft Excel e fornece um conjunto de APIs para várias linguagens de programação, incluindo Python. Usaremos Aspose.Cells for Python via .NET para excluir linhas e colunas em branco em planilhas do Excel. Ele permite criar, manipular e converter arquivos Excel em seus aplicativos Python.

Por favor baixe o pacote ou instale a API de PyPI usando o seguinte comando pip no console:

pip install aspose-cells-python

Exclua todas as linhas em branco no Excel usando Python

Para eliminar linhas vazias ou em branco no Excel, a API fornece o método delete_blank_rows() para remover quaisquer linhas com valores ausentes ou vazios. Podemos excluir linhas em branco em uma planilha do Excel seguindo as etapas abaixo:

  1. Carregue o arquivo Excel usando a classe Workbook.
  2. Acesse a planilha desejada na coleção de planilhas.
  3. Depois disso, exclua as linhas em branco usando o método cell.delete_blank_rows().
  4. Por fim, salve o arquivo resultante usando o método workbook.save(string).

O exemplo de código a seguir mostra como excluir linhas em branco de uma planilha do Excel em Python.

# importe o pacote python
import aspose.cells
from aspose.cells import License, Workbook, DeleteOptions

# Instanciar um objeto Workbook pelo caminho do arquivo Excel
workbook = Workbook("D:\\Files\\Book1.xlsx")

# Obtenha a primeira planilha
worksheet = workbook.worksheets[0]

# Exclua as linhas em branco da planilha
worksheet.cells.delete_blank_rows();

# Salve o arquivo Excel modificado
workbook.save("D:\\Files\\DeletedBlankRows.xlsx")
Exclua todas as linhas em branco no Excel usando Python

Exclua todas as linhas em branco no Excel usando Python

Exclua colunas em branco no Excel usando Python

A exclusão de colunas em branco segue uma abordagem semelhante. A API fornece o método delete_blank_columns() para remover quaisquer colunas com valores ausentes ou vazios. Podemos excluir colunas em branco em uma planilha do Excel seguindo as etapas abaixo:

  1. Carregue o arquivo Excel usando a classe Workbook.
  2. Acesse a planilha desejada na coleção de planilhas.
  3. Depois disso, exclua todas as colunas em branco usando o método cell.delete_blank_columns().
  4. Por fim, salve o arquivo resultante usando o método workbook.save(string).

O exemplo de código a seguir mostra como excluir colunas em branco de uma planilha do Excel em Python.

# importe o pacote python
import aspose.cells
from aspose.cells import License, Workbook, DeleteOptions

# Instanciar um objeto Workbook pelo caminho do arquivo Excel
workbook = Workbook("D:\\Files\\Book1.xlsx")

# Obtenha a primeira planilha
worksheet = workbook.worksheets[0]

# Exclua as linhas em branco da planilha
worksheet.cells.delete_blank_columns();

# Salve o arquivo Excel modificado no formato padrão (ou seja, Excel 2003)
workbook.save("D:\\Files\\DeletedBlankCols.xlsx")
Exclua colunas em branco no Excel usando Python

Exclua colunas em branco no Excel usando Python

Atualizar referências ao excluir linhas e colunas em branco no Excel usando Python

Em certos casos, quando removemos colunas e linhas vazias de uma planilha, isso pode levar a referências inválidas em outras planilhas. Podemos evitar esse problema utilizando a propriedade DeleteOptions.update_reference e definindo-a como True. Ele garante que as referências à planilha atual em outras planilhas sejam atualizadas adequadamente.

Podemos atualizar referências em outras planilhas enquanto excluímos colunas e linhas em branco em uma planilha seguindo as etapas abaixo:

  1. Carregue o arquivo Excel usando a classe Workbook.
  2. Acesse a planilha desejada na coleção de planilhas.
  3. Calcule fórmulas da pasta de trabalho usando o método workbook.calculate_formula().
  4. Especifique DeleteOptions.update_reference como verdadeiro.
  5. Exclua linhas ou colunas em branco usando os métodos delete_blank_rows(DeleteOptions) ou delete_blank_columns(DeleteOptions).
  6. Recalcule as fórmulas da pasta de trabalho usando o método workbook.calculate_formula().
  7. Por fim, salve o arquivo resultante usando o método workbook.save(string).

O exemplo de código a seguir mostra como atualizar referências em outras planilhas ao excluir linhas ou colunas em branco no Excel usando Python.

# importe o pacote python
import aspose.cells
from aspose.cells import License, Workbook, DeleteOptions

# Instanciar um objeto Workbook pelo caminho do arquivo Excel
workbook = Workbook("D:\\Files\\Book1.xlsx")

# Obtenha a primeira planilha
worksheet = workbook.worksheets[0]

# Calcular fórmulas da pasta de trabalho
workbook.calculate_formula();

# Se você comentar a propriedade DeleteOptions.UpdateReference abaixo, a fórmula na célula E3 da segunda planilha não será atualizada
opts = DeleteOptions();
opts.update_reference = True;

# Exclua as linhas e colunas em branco da planilha
worksheet.cells.delete_blank_rows(opts);
worksheet.cells.delete_blank_columns(opts);

# Calcular fórmulas da pasta de trabalho
workbook.calculate_formula();

# Salve o arquivo Excel modificado no formato padrão (ou seja, Excel 2003)
workbook.save("D:\\Files\\UpdateRef.xlsx")

Obtenha uma licença API gratuita

Você pode obter uma licença temporária gratuita para usar a API sem limitações de avaliação.

Exclua linhas em branco no Excel – Recursos de aprendizagem

Além de excluir linhas e colunas em branco de planilhas do Excel, aprenda mais sobre como criar, manipular e converter arquivos do Excel e explore vários outros recursos da biblioteca usando os recursos abaixo:

Conclusão

Neste artigo, demonstramos como excluir linhas e colunas em branco no Excel sem esforço usando Python. Aproveitando o poder do Aspose.Cells for Python, podemos limpar nossos dados com eficiência e aumentar a precisão. Ao automatizar esta tarefa, você pode economizar um tempo valioso e se concentrar em outros aspectos do seu projeto. Em caso de qualquer ambiguidade, entre em contato conosco em nosso fórum de suporte gratuito.

Veja também