Odczytywanie danych w plikach Excela za pomocą Python

MS Excel zapewnia wygodny sposób przechowywania i udostępniania danych w postaci wierszy i kolumn. Częściej pliki Excel są używane do przechowywania ogromnych zestawów danych zawierających setki i tysiące rekordów. Podczas pracy z plikami Excela w Python może być konieczne odczytanie danych z każdej komórki w arkuszu. Aby to osiągnąć, w tym artykule pokazano, jak czytać plik Excela w Python. Nauczysz się odczytywać dane z pojedynczego arkusza lub ze wszystkich arkuszy w skoroszycie programu Excel.

Biblioteka Python do odczytu plików Excela

Do odczytania danych ze skoroszytów użyjemy Aspose.Cells for Python via Java. Jest to potężna i bogata w funkcje biblioteka Python do tworzenia plików MS Excel. Co więcej, umożliwia bezproblemowe odczytywanie i manipulowanie istniejącymi plikami Excel. Możesz pobrać bibliotekę lub zainstalować ją za pomocą następującego polecenia pip.

pip install aspose-cells

Przeczytaj plik Excela w Python

Zanim zaczniemy odczytywać dane, przyjrzyjmy się, jak dane są zarządzane w pliku programu Excel. Plik programu Excel jest określany jako skoroszyt, który działa jak kontener. Każdy skoroszyt zawiera jeden lub więcej arkuszy, a każdy arkusz składa się z pewnej liczby komórek. Komórki te są jednoznacznie identyfikowane przez wiersze i kolumny. Aby więc odczytać dane z komórki, musisz znać jej indeks wierszy i kolumn.

Poniżej przedstawiono kroki, aby odczytać plik Excel i wydrukować jego dane w Python.

Poniższy przykładowy kod pokazuje, jak odczytać plik programu Excel w języku Python.

# Załaduj skoroszyt programu Excel
wb = Workbook("workbook.xlsx")

# Pobierz kolekcję arkuszy roboczych
collection = wb.getWorksheets()
collectionCount = collection.getCount()

# Przejrzyj w pętli wszystkie arkusze
for worksheetIndex in range(collectionCount):

    # Pobierz arkusz roboczy, korzystając z jego indeksu
    worksheet = collection.get(worksheetIndex)

    # Wydrukuj nazwę arkusza
    print("Worksheet: " + str(worksheet.getName()))

    # Uzyskaj liczbę wierszy i kolumn
    rows = worksheet.getCells().getMaxDataRow()
    cols = worksheet.getCells().getMaxDataColumn()

    # Zapętlaj rzędy
   for i in range(rows):

        # Przejdź przez każdą kolumnę w wybranym rzędzie
       for j in range(cols):
            # Wydrukuj wartość komórki
            print(worksheet.getCells().get(i, j).getValue(), end =" | ")

        # Przerwa w linii wydruku
        print("\n")

Poniżej przedstawiono dane wyjściowe, które otrzymujemy po uruchomieniu powyższego przykładowego kodu.

Odczytywanie danych w arkuszach pliku Excel w Python

Czytanie pliku Excela w Python

Przeczytaj określony arkusz kalkulacyjny w Excelu w Python

Możesz także przeczytać określony arkusz w pliku Excel, wykonując poniższe czynności.

Poniższy przykładowy kod pokazuje, jak odczytywać dane z określonego arkusza w języku Python.

# Załaduj skoroszyt programu Excel
wb = Workbook("workbook.xlsx")

# Pobierz kolekcję arkuszy roboczych
worksheet = wb.getWorksheets().get(0)   

# Wydrukuj nazwę arkusza
print("Worksheet: " + str(worksheet.getName()))

# Uzyskaj liczbę wierszy i kolumn
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()

# Zapętlaj rzędy
for i in range(rows):

    # Przejdź przez każdą kolumnę w wybranym rzędzie
   for j in range(cols):
        # wydrukuj wartość komórki
        print(worksheet.getCells().get(i, j).getValue(), end =" | ")

    # Przerwa w linii wydruku
    print("\n")

Uzyskaj bezpłatną licencję API

Możesz używać Aspose.Cells for Python przez Javę bez ograniczeń ewaluacyjnych, prosząc o darmową licencję tymczasową.

Wniosek

W tym artykule nauczyłeś się czytać pliki Excela w Python. Ponadto widziałeś, jak odczytywać dane z określonego arkusza lub wszystkich arkuszy w skoroszycie programu Excel. Możesz dowiedzieć się więcej o bibliotece arkuszy kalkulacyjnych Python, korzystając z dokumentacji. Jeśli masz jakieś pytania lub wątpliwości, daj nam znać za pośrednictwem naszego forum.

Zobacz też