Ler dados em arquivos do Excel usando Python

O MS Excel fornece uma maneira conveniente de manter e compartilhar dados na forma de linhas e colunas. Mais frequentemente, os arquivos do Excel são usados para armazenar grandes conjuntos de dados com centenas e milhares de registros. Ao trabalhar com arquivos do Excel em Python, pode ser necessário ler dados de cada célula nas planilhas. Para conseguir isso, este artigo mostra como ler um arquivo do Excel em Python. Você aprenderá a ler dados de uma única planilha ou de todas as planilhas de uma pasta de trabalho do Excel.

Biblioteca Python para ler arquivos do Excel

Para ler os dados das pastas de trabalho, usaremos Aspose.Cells for Python via Java. É uma biblioteca Python poderosa e rica em recursos para criar arquivos MS Excel. Além disso, permite que você leia e manipule arquivos Excel existentes sem problemas. Você pode baixar a biblioteca ou instalá-la usando o seguinte comando pip.

pip install aspose-cells

Ler um arquivo do Excel em Python

Antes de começarmos a ler os dados, vamos ter uma visão geral de como os dados são gerenciados em um arquivo Excel. Um arquivo do Excel é denominado como pasta de trabalho que atua como um contêiner. Cada pasta de trabalho contém uma ou mais planilhas e cada planilha é composta por várias células. Essas células são identificadas exclusivamente pelas linhas e colunas. Portanto, para ler os dados de uma célula, você precisa conhecer seu índice de linha e coluna.

A seguir estão as etapas para ler um arquivo do Excel e imprimir seus dados em Python.

O exemplo de código a seguir mostra como ler um arquivo do Excel em Python.

# Load Excel workbook
wb = Workbook("workbook.xlsx")

# Get worksheets collection
collection = wb.getWorksheets()
collectionCount = collection.getCount()

# Loop through all the worksheets
for worksheetIndex in range(collectionCount):

    # Get worksheet using its index
    worksheet = collection.get(worksheetIndex)

    # Print worksheet name
    print("Worksheet: " + str(worksheet.getName()))

    # Get number of rows and columns
    rows = worksheet.getCells().getMaxDataRow()
    cols = worksheet.getCells().getMaxDataColumn()

    # Loop through rows
    for i in range(rows):

        # Loop through each column in selected row
        for j in range(cols):
            # Print cell value
            print(worksheet.getCells().get(i, j).getValue(), end =" | ")

        # Print line break
        print("\n")

A seguir está a saída que obtemos depois de executar o exemplo de código acima.

Lendo dados nas planilhas do arquivo Excel em Python

Lendo um arquivo do Excel em Python

Leia uma planilha específica no Excel em Python

Você também pode ler uma planilha específica no arquivo Excel seguindo as etapas abaixo.

O exemplo de código a seguir mostra como ler dados de uma planilha específica em Python.

# Load Excel workbook
wb = Workbook("workbook.xlsx")

# Get worksheets collection
worksheet = wb.getWorksheets().get(0)   

# Print worksheet name
print("Worksheet: " + str(worksheet.getName()))

# Get number of rows and columns
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()

# Loop through rows
for i in range(rows):

    # Loop through each column in selected row
    for j in range(cols):
        # print cell value
        print(worksheet.getCells().get(i, j).getValue(), end =" | ")

    # Print line break
    print("\n")

Obtenha uma licença de API gratuita

Você pode usar o Aspose.Cells para Python via Java sem limitações de avaliação solicitando uma licença temporária gratuita.

Conclusão

Neste artigo, você aprendeu a ler arquivos do Excel em Python. Além disso, você viu como ler dados de uma planilha específica ou de todas as planilhas de uma pasta de trabalho do Excel. Você pode explorar mais sobre a biblioteca de planilhas Python usando a documentação. Caso você tenha alguma dúvida ou pergunta, sinta-se à vontade para nos informar através do nosso fórum.

Veja também