MS Excel bietet eine bequeme Möglichkeit, Daten in Form von Zeilen und Spalten zu speichern und zu teilen. Häufiger werden Excel Dateien verwendet, um riesige Datensätze mit Hunderten und Tausenden von Datensätzen zu speichern. Beim Arbeiten mit Excel Dateien in Python müssen Sie möglicherweise Daten aus jeder Zelle in den Arbeitsblättern lesen. Um dies zu erreichen, zeigt dieser Artikel, wie man eine Excel Datei in Python liest. Sie lernen, wie Sie Daten aus einem einzelnen Arbeitsblatt oder allen Arbeitsblättern in einer Excel Arbeitsmappe lesen.
- Python Bibliothek zum Lesen von Excel Dateien
- Lesen Sie Daten aus einer Excel Datei
- Lesen Sie ein Arbeitsblatt in einer Excel Arbeitsmappe
Python Bibliothek zum Lesen von Excel Dateien
Um Daten aus den Arbeitsmappen zu lesen, verwenden wir Aspose.Cells for Python via Java. Es ist eine leistungsstarke und funktionsreiche Python Bibliothek zum Erstellen von MS Excel Dateien. Darüber hinaus können Sie vorhandene Excel Dateien nahtlos lesen und bearbeiten. Sie können die Bibliothek herunterladen oder mit dem folgenden Pip Befehl installieren.
pip install aspose-cells
Lesen Sie eine Excel Datei in Python
Bevor wir mit dem Auslesen der Daten beginnen, verschaffen wir uns einen Überblick darüber, wie die Daten in einer Excel Datei verwaltet werden. Eine Excel Datei wird als Arbeitsmappe bezeichnet, die als Container fungiert. Jede Arbeitsmappe enthält ein oder mehrere Arbeitsblätter und jedes Arbeitsblatt besteht aus einer Reihe von Zellen. Diese Zellen werden durch die Zeilen und Spalten eindeutig identifiziert. Um also Daten aus einer Zelle zu lesen, müssen Sie ihren Zeilen und Spaltenindex kennen.
Im Folgenden sind die Schritte zum Lesen einer Excel Datei und zum Drucken ihrer Daten in Python aufgeführt.
- Laden Sie die Excel Datei mit der Klasse Workbook.
- Rufen Sie die Referenz der WorksheetCollection mithilfe der Methode Workbook.getWorksheets() ab.
- Durchlaufen Sie die Arbeitsblätter in der Sammlung und führen Sie in jeder Iteration die folgenden Schritte aus:
- Rufen Sie den Verweis auf das Arbeitsblatt in einem Objekt ab.
- Rufen Sie die Anzahl der Datenzeilen und -spalten im Arbeitsblatt ab.
- Starten Sie eine Schleife für Zeilen.
- Starten Sie eine verschachtelte Schleife für Spalten.
- Lesen Sie Daten aus jeder Zelle mit der methode Worksheet.getCells().get(rowIndex, columnIndex).getValue().
Das folgende Codebeispiel zeigt, wie eine Excel Datei in Python gelesen wird.
# Load Excel workbook
wb = Workbook("workbook.xlsx")
# Get worksheets collection
collection = wb.getWorksheets()
collectionCount = collection.getCount()
# Loop through all the worksheets
for worksheetIndex in range(collectionCount):
# Get worksheet using its index
worksheet = collection.get(worksheetIndex)
# Print worksheet name
print("Worksheet: " + str(worksheet.getName()))
# Get number of rows and columns
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()
# Loop through rows
for i in range(rows):
# Loop through each column in selected row
for j in range(cols):
# Print cell value
print(worksheet.getCells().get(i, j).getValue(), end =" | ")
# Print line break
print("\n")
Das Folgende ist die Ausgabe, die wir nach dem Ausführen des obigen Codebeispiels erhalten.
Lesen Sie ein bestimmtes Arbeitsblatt in Excel in Python
Sie können auch ein bestimmtes Arbeitsblatt in der Excel Datei lesen, indem Sie die folgenden Schritte ausführen.
- Laden Sie die Excel Datei mit der Klasse Workbook.
- Rufen Sie die Referenz des gewünschten Arbeitsblatts mit der methode Workbook.getWorksheets().get(index) ab.
- Rufen Sie die Anzahl der Datenzeilen und -spalten im Arbeitsblatt ab.
- Starten Sie eine Schleife für Zeilen.
- Starten Sie eine verschachtelte Schleife für Spalten.
- Lesen Sie Daten aus jeder Zelle mit der methode Worksheet.getCells().get(rowIndex, columnIndex).getValue().
Das folgende Codebeispiel zeigt, wie Daten aus einem bestimmten Arbeitsblatt in Python gelesen werden.
# Load Excel workbook
wb = Workbook("workbook.xlsx")
# Get worksheets collection
worksheet = wb.getWorksheets().get(0)
# Print worksheet name
print("Worksheet: " + str(worksheet.getName()))
# Get number of rows and columns
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()
# Loop through rows
for i in range(rows):
# Loop through each column in selected row
for j in range(cols):
# print cell value
print(worksheet.getCells().get(i, j).getValue(), end =" | ")
# Print line break
print("\n")
Holen Sie sich eine kostenlose API Lizenz
Sie können Aspose.Cells for Python über Java ohne Evaluierungseinschränkungen verwenden, indem Sie eine kostenlose temporäre Lizenz anfordern.
Fazit
In diesem Artikel haben Sie gelernt, wie Sie Excel Dateien in Python lesen. Darüber hinaus haben Sie gesehen, wie Sie Daten aus einem bestimmten Arbeitsblatt oder allen Arbeitsblättern in einer Excel Arbeitsmappe lesen. Weitere Informationen zur Python-Tabellenbibliothek finden Sie in der Dokumentation. Falls Sie Fragen oder Anregungen haben, können Sie uns diese gerne über unser Forum mitteilen.