O MS Excel fornece uma maneira conveniente de manter e compartilhar dados na forma de linhas e colunas. Mais frequentemente, os arquivos do Excel são usados para armazenar grandes conjuntos de dados com centenas e milhares de registros. Ao trabalhar com arquivos do Excel em Python, pode ser necessário ler dados de cada célula nas planilhas. Para conseguir isso, este artigo mostra como ler um arquivo do Excel em Python. Você aprenderá a ler dados de uma única planilha ou de todas as planilhas de uma pasta de trabalho do Excel.
- Biblioteca Python para ler arquivos do Excel
- Ler dados de um arquivo do Excel
- Ler uma planilha em uma pasta de trabalho do Excel
Biblioteca Python para ler arquivos do Excel
Para ler os dados das pastas de trabalho, usaremos Aspose.Cells for Python via Java. É uma biblioteca Python poderosa e rica em recursos para criar arquivos MS Excel. Além disso, permite que você leia e manipule arquivos Excel existentes sem problemas. Você pode baixar a biblioteca ou instalá-la usando o seguinte comando pip.
pip install aspose-cells
Ler um arquivo do Excel em Python
Antes de começarmos a ler os dados, vamos ter uma visão geral de como os dados são gerenciados em um arquivo Excel. Um arquivo do Excel é denominado como pasta de trabalho que atua como um contêiner. Cada pasta de trabalho contém uma ou mais planilhas e cada planilha é composta por várias células. Essas células são identificadas exclusivamente pelas linhas e colunas. Portanto, para ler os dados de uma célula, você precisa conhecer seu índice de linha e coluna.
A seguir estão as etapas para ler um arquivo do Excel e imprimir seus dados em Python.
- Carregue o arquivo Excel usando a classe Workbook.
- Obtenha a referência do WorksheetCollection usando o método Workbook.getWorksheets().
- Percorra as planilhas na coleção e em cada iteração, execute as seguintes etapas:
- Obter referência da planilha em um objeto.
- Obtenha a contagem de linhas e colunas de dados na planilha.
- Inicie um loop para linhas.
- Inicie um loop aninhado para colunas.
- Leia os dados de cada célula usando o método Worksheet.getCells().get(rowIndex, columnIndex).getValue().
O exemplo de código a seguir mostra como ler um arquivo do Excel em Python.
# Load Excel workbook
wb = Workbook("workbook.xlsx")
# Get worksheets collection
collection = wb.getWorksheets()
collectionCount = collection.getCount()
# Loop through all the worksheets
for worksheetIndex in range(collectionCount):
# Get worksheet using its index
worksheet = collection.get(worksheetIndex)
# Print worksheet name
print("Worksheet: " + str(worksheet.getName()))
# Get number of rows and columns
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()
# Loop through rows
for i in range(rows):
# Loop through each column in selected row
for j in range(cols):
# Print cell value
print(worksheet.getCells().get(i, j).getValue(), end =" | ")
# Print line break
print("\n")
A seguir está a saída que obtemos depois de executar o exemplo de código acima.
Leia uma planilha específica no Excel em Python
Você também pode ler uma planilha específica no arquivo Excel seguindo as etapas abaixo.
- Carregue o arquivo Excel usando a classe Workbook.
- Obtenha a referência da planilha desejada usando o método Workbook.getWorksheets().get(index).
- Obtenha a contagem de linhas e colunas de dados na planilha.
- Inicie um loop para linhas.
- Inicie um loop aninhado para colunas.
- Leia os dados de cada célula usando o método Worksheet.getCells().get(rowIndex, columnIndex).getValue().
O exemplo de código a seguir mostra como ler dados de uma planilha específica em Python.
# Load Excel workbook
wb = Workbook("workbook.xlsx")
# Get worksheets collection
worksheet = wb.getWorksheets().get(0)
# Print worksheet name
print("Worksheet: " + str(worksheet.getName()))
# Get number of rows and columns
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()
# Loop through rows
for i in range(rows):
# Loop through each column in selected row
for j in range(cols):
# print cell value
print(worksheet.getCells().get(i, j).getValue(), end =" | ")
# Print line break
print("\n")
Obtenha uma licença de API gratuita
Você pode usar o Aspose.Cells para Python via Java sem limitações de avaliação solicitando uma licença temporária gratuita.
Conclusão
Neste artigo, você aprendeu a ler arquivos do Excel em Python. Além disso, você viu como ler dados de uma planilha específica ou de todas as planilhas de uma pasta de trabalho do Excel. Você pode explorar mais sobre a biblioteca de planilhas Python usando a documentação. Caso você tenha alguma dúvida ou pergunta, sinta-se à vontade para nos informar através do nosso fórum.