Lesen Sie Daten in Excel Dateien mit Python

MS Excel bietet eine bequeme Möglichkeit, Daten in Form von Zeilen und Spalten zu speichern und zu teilen. Häufiger werden Excel Dateien verwendet, um riesige Datensätze mit Hunderten und Tausenden von Datensätzen zu speichern. Beim Arbeiten mit Excel Dateien in Python müssen Sie möglicherweise Daten aus jeder Zelle in den Arbeitsblättern lesen. Um dies zu erreichen, zeigt dieser Artikel, wie man eine Excel Datei in Python liest. Sie lernen, wie Sie Daten aus einem einzelnen Arbeitsblatt oder allen Arbeitsblättern in einer Excel Arbeitsmappe lesen.

Python Bibliothek zum Lesen von Excel Dateien

Um Daten aus den Arbeitsmappen zu lesen, verwenden wir Aspose.Cells for Python via Java. Es ist eine leistungsstarke und funktionsreiche Python Bibliothek zum Erstellen von MS Excel Dateien. Darüber hinaus können Sie vorhandene Excel Dateien nahtlos lesen und bearbeiten. Sie können die Bibliothek herunterladen oder mit dem folgenden Pip Befehl installieren.

pip install aspose-cells

Lesen Sie eine Excel Datei in Python

Bevor wir mit dem Auslesen der Daten beginnen, verschaffen wir uns einen Überblick darüber, wie die Daten in einer Excel Datei verwaltet werden. Eine Excel Datei wird als Arbeitsmappe bezeichnet, die als Container fungiert. Jede Arbeitsmappe enthält ein oder mehrere Arbeitsblätter und jedes Arbeitsblatt besteht aus einer Reihe von Zellen. Diese Zellen werden durch die Zeilen und Spalten eindeutig identifiziert. Um also Daten aus einer Zelle zu lesen, müssen Sie ihren Zeilen und Spaltenindex kennen.

Im Folgenden sind die Schritte zum Lesen einer Excel Datei und zum Drucken ihrer Daten in Python aufgeführt.

  • Laden Sie die Excel Datei mit der Klasse Workbook.
  • Rufen Sie die Referenz der WorksheetCollection mithilfe der Methode Workbook.getWorksheets() ab.
  • Durchlaufen Sie die Arbeitsblätter in der Sammlung und führen Sie in jeder Iteration die folgenden Schritte aus:
    • Rufen Sie den Verweis auf das Arbeitsblatt in einem Objekt ab.
    • Rufen Sie die Anzahl der Datenzeilen und -spalten im Arbeitsblatt ab.
    • Starten Sie eine Schleife für Zeilen.
    • Starten Sie eine verschachtelte Schleife für Spalten.
    • Lesen Sie Daten aus jeder Zelle mit der methode Worksheet.getCells().get(rowIndex, columnIndex).getValue().

Das folgende Codebeispiel zeigt, wie eine Excel Datei in Python gelesen wird.

# Load Excel workbook
wb = Workbook("workbook.xlsx")

# Get worksheets collection
collection = wb.getWorksheets()
collectionCount = collection.getCount()

# Loop through all the worksheets
for worksheetIndex in range(collectionCount):

    # Get worksheet using its index
    worksheet = collection.get(worksheetIndex)

    # Print worksheet name
    print("Worksheet: " + str(worksheet.getName()))

    # Get number of rows and columns
    rows = worksheet.getCells().getMaxDataRow()
    cols = worksheet.getCells().getMaxDataColumn()

    # Loop through rows
    for i in range(rows):

        # Loop through each column in selected row
        for j in range(cols):
            # Print cell value
            print(worksheet.getCells().get(i, j).getValue(), end =" | ")

        # Print line break
        print("\n")

Das Folgende ist die Ausgabe, die wir nach dem Ausführen des obigen Codebeispiels erhalten.

Lesen von Daten in den Arbeitsblättern der Excel Datei in Python

Lesen einer Excel Datei in Python

Lesen Sie ein bestimmtes Arbeitsblatt in Excel in Python

Sie können auch ein bestimmtes Arbeitsblatt in der Excel Datei lesen, indem Sie die folgenden Schritte ausführen.

Das folgende Codebeispiel zeigt, wie Daten aus einem bestimmten Arbeitsblatt in Python gelesen werden.

# Load Excel workbook
wb = Workbook("workbook.xlsx")

# Get worksheets collection
worksheet = wb.getWorksheets().get(0)   

# Print worksheet name
print("Worksheet: " + str(worksheet.getName()))

# Get number of rows and columns
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()

# Loop through rows
for i in range(rows):

    # Loop through each column in selected row
    for j in range(cols):
        # print cell value
        print(worksheet.getCells().get(i, j).getValue(), end =" | ")

    # Print line break
    print("\n")

Holen Sie sich eine kostenlose API Lizenz

Sie können Aspose.Cells for Python über Java ohne Evaluierungseinschränkungen verwenden, indem Sie eine kostenlose temporäre Lizenz anfordern.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie Excel Dateien in Python lesen. Darüber hinaus haben Sie gesehen, wie Sie Daten aus einem bestimmten Arbeitsblatt oder allen Arbeitsblättern in einer Excel Arbeitsmappe lesen. Weitere Informationen zur Python-Tabellenbibliothek finden Sie in der Dokumentation. Falls Sie Fragen oder Anregungen haben, können Sie uns diese gerne über unser Forum mitteilen.

Siehe auch