Eliminar filas y columnas en blanco en Excel usando Python

Microsoft Excel se utiliza ampliamente para organizar y administrar datos de manera eficiente. Sin embargo, trabajar con filas y columnas vacías en hojas de cálculo de Excel (XLS o XLSX) puede ser una tarea tediosa y que requiere mucho tiempo. Las filas y columnas en blanco a menudo pueden deberse a la importación de datos de diversas fuentes o a una entrada de datos incompleta. Independientemente del motivo, estas celdas vacías pueden alterar la precisión de nuestro análisis y aumentar el tamaño del archivo. Nuestro objetivo es identificar y eliminar dichas filas y columnas rápidamente, ahorrando tiempo y esfuerzo. Podemos automatizar este proceso y optimizar nuestro flujo de trabajo de limpieza de datos mediante programación en Python. En este artículo, exploraremos una técnica poderosa para eliminar filas y columnas en blanco en Excel usando Python.

Este artículo cubre los siguientes temas:

  1. API de Python para eliminar filas y columnas en blanco en Excel
  2. Eliminar filas en blanco en una hoja de cálculo de Excel usando Python
  3. Eliminar columnas en blanco en una hoja de cálculo de Excel usando Python
  4. Actualizar referencia mientras se eliminan filas y columnas en blanco
  5. Recursos de aprendizaje gratuitos

Biblioteca Python para eliminar filas y columnas de Excel

Aspose.Cells es una biblioteca popular para trabajar con archivos de Microsoft Excel y proporciona un conjunto de API para varios lenguajes de programación, incluido Python. Usaremos Aspose.Cells for Python vía .NET para eliminar filas y columnas en blanco en hojas de cálculo de Excel. Le permite crear, manipular y convertir archivos de Excel en sus aplicaciones Python.

Por favor descargue el paquete o instale la API desde PyPI usando el siguiente comando pip en la consola:

pip install aspose-cells-python

Eliminar todas las filas en blanco en Excel usando Python

Para eliminar filas vacías o en blanco en Excel, la API proporciona el método delete_blank_rows() para eliminar cualquier fila con valores faltantes o vacíos. Podemos eliminar filas en blanco en una hoja de cálculo de Excel siguiendo los pasos a continuación:

  1. Cargue el archivo de Excel usando la clase Workbook.
  2. Acceda a la hoja de trabajo deseada de la colección de hojas de trabajo.
  3. Después de eso, elimine las filas en blanco usando el método cell.delete_blank_rows().
  4. Finalmente, guarde el archivo resultante usando el método workbook.save(string).

El siguiente ejemplo de código muestra cómo eliminar filas en blanco de una hoja de cálculo de Excel en Python.

# importar el paquete de Python
import aspose.cells
from aspose.cells import License, Workbook, DeleteOptions

# Crear una instancia de un objeto de libro de trabajo mediante la ruta del archivo de Excel
workbook = Workbook("D:\\Files\\Book1.xlsx")

# Obtenga la primera hoja de trabajo
worksheet = workbook.worksheets[0]

# Eliminar las filas en blanco de la hoja de trabajo
worksheet.cells.delete_blank_rows();

# Guarde el archivo de Excel modificado
workbook.save("D:\\Files\\DeletedBlankRows.xlsx")
Eliminar todas las filas en blanco en Excel usando Python

Eliminar todas las filas en blanco en Excel usando Python

Eliminar columnas en blanco en Excel usando Python

La eliminación de columnas en blanco sigue un enfoque similar. La API proporciona el método delete_blank_columns() para eliminar cualquier columna con valores faltantes o vacíos. Podemos eliminar columnas en blanco en una hoja de cálculo de Excel siguiendo los pasos a continuación:

  1. Cargue el archivo de Excel usando la clase Workbook.
  2. Acceda a la hoja de trabajo deseada de la colección de hojas de trabajo.
  3. Después de eso, elimine todas las columnas en blanco usando el método cell.delete_blank_columns().
  4. Finalmente, guarde el archivo resultante usando el método workbook.save(string).

El siguiente ejemplo de código muestra cómo eliminar columnas en blanco de una hoja de cálculo de Excel en Python.

# importar el paquete de Python
import aspose.cells
from aspose.cells import License, Workbook, DeleteOptions

# Crear una instancia de un objeto de libro de trabajo mediante la ruta del archivo de Excel
workbook = Workbook("D:\\Files\\Book1.xlsx")

# Obtenga la primera hoja de trabajo
worksheet = workbook.worksheets[0]

# Eliminar las filas en blanco de la hoja de trabajo
worksheet.cells.delete_blank_columns();

# Guarde el archivo de Excel modificado en el formato predeterminado (es decir, Excel 2003)
workbook.save("D:\\Files\\DeletedBlankCols.xlsx")
Eliminar columnas en blanco en Excel usando Python

Eliminar columnas en blanco en Excel usando Python

Actualizar referencias al eliminar filas y columnas en blanco en Excel usando Python

En ciertos casos, cuando eliminamos columnas y filas vacías de una hoja de trabajo, podemos generar referencias no válidas en otras hojas de trabajo. Podemos evitar este problema utilizando la propiedad DeleteOptions.update_reference y configurándola en Verdadero. Garantiza que las referencias a la hoja de trabajo actual en otras hojas se actualicen en consecuencia.

Podemos actualizar las referencias en otras hojas de trabajo mientras eliminamos columnas y filas en blanco en una hoja de trabajo siguiendo los pasos a continuación:

  1. Cargue el archivo de Excel usando la clase Workbook.
  2. Acceda a la hoja de trabajo deseada de la colección de hojas de trabajo.
  3. Calcule las fórmulas del libro de trabajo utilizando el método workbook.calculate_formula().
  4. Especifique la referencia DeleteOptions.update en verdadero.
  5. Elimine filas o columnas en blanco utilizando los métodos eliminar filas en blanco (DeleteOptions) o eliminar columnas en blanco (DeleteOptions).
  6. Vuelva a calcular las fórmulas del libro de trabajo utilizando el método workbook.calculate_formula().
  7. Finalmente, guarde el archivo resultante usando el método workbook.save(string).

El siguiente ejemplo de código muestra cómo actualizar referencias en otras hojas de trabajo mientras se eliminan filas o columnas en blanco en Excel usando Python.

# importar el paquete de Python
import aspose.cells
from aspose.cells import License, Workbook, DeleteOptions

# Crear una instancia de un objeto de libro de trabajo mediante la ruta del archivo de Excel
workbook = Workbook("D:\\Files\\Book1.xlsx")

# Obtenga la primera hoja de trabajo
worksheet = workbook.worksheets[0]

# Calcular fórmulas del libro de trabajo.
workbook.calculate_formula();

# Si comenta la propiedad DeleteOptions.UpdateReference a continuación, la fórmula en la celda E3 en la segunda hoja no se actualizará
opts = DeleteOptions();
opts.update_reference = True;

# Eliminar las filas y columnas en blanco de la hoja de trabajo
worksheet.cells.delete_blank_rows(opts);
worksheet.cells.delete_blank_columns(opts);

# Calcular fórmulas del libro de trabajo.
workbook.calculate_formula();

# Guarde el archivo de Excel modificado en el formato predeterminado (es decir, Excel 2003)
workbook.save("D:\\Files\\UpdateRef.xlsx")

Obtenga una licencia API gratuita

Puede obtener una licencia temporal gratuita para utilizar la API sin limitaciones de evaluación.

Eliminar líneas en blanco en Excel – Recursos de aprendizaje

Además de eliminar filas y columnas en blanco de las hojas de cálculo de Excel, obtenga más información sobre cómo crear, manipular y convertir archivos de Excel y explore otras funciones de la biblioteca utilizando los recursos siguientes:

Conclusión

En este artículo, hemos demostrado cómo eliminar filas y columnas en blanco en Excel sin esfuerzo usando Python. Al aprovechar el poder de Aspose.Cells for Python, podemos limpiar nuestros datos de manera eficiente y mejorar la precisión. Al automatizar esta tarea, puede ahorrar un tiempo valioso y concentrarse en otros aspectos de su proyecto. En caso de cualquier ambigüedad, contáctenos en nuestro foro de soporte gratuito.

Ver también