MS Excel zapewnia wygodny sposób przechowywania i udostępniania danych w postaci wierszy i kolumn. Częściej pliki Excel są używane do przechowywania ogromnych zestawów danych zawierających setki i tysiące rekordów. Podczas pracy z plikami Excela w Python może być konieczne odczytanie danych z każdej komórki w arkuszu. Aby to osiągnąć, w tym artykule pokazano, jak czytać plik Excela w Python. Nauczysz się odczytywać dane z pojedynczego arkusza lub ze wszystkich arkuszy w skoroszycie programu Excel.
- Biblioteka Python do odczytu plików Excela
- Odczyt danych z pliku Excel
- Przeczytaj arkusz w skoroszycie programu Excel
Biblioteka Python do odczytu plików Excela
Do odczytania danych ze skoroszytów użyjemy Aspose.Cells for Python via Java. Jest to potężna i bogata w funkcje biblioteka Python do tworzenia plików MS Excel. Co więcej, umożliwia bezproblemowe odczytywanie i manipulowanie istniejącymi plikami Excel. Możesz pobrać bibliotekę lub zainstalować ją za pomocą następującego polecenia pip.
pip install aspose-cells
Przeczytaj plik Excela w Python
Zanim zaczniemy odczytywać dane, przyjrzyjmy się, jak dane są zarządzane w pliku programu Excel. Plik programu Excel jest określany jako skoroszyt, który działa jak kontener. Każdy skoroszyt zawiera jeden lub więcej arkuszy, a każdy arkusz składa się z pewnej liczby komórek. Komórki te są jednoznacznie identyfikowane przez wiersze i kolumny. Aby więc odczytać dane z komórki, musisz znać jej indeks wierszy i kolumn.
Poniżej przedstawiono kroki, aby odczytać plik Excel i wydrukować jego dane w Python.
- Załaduj plik Excela, używając klasy Workbook.
- Pobierz odwołanie do WorksheetCollection przy użyciu metody Workbook.getWorksheets().
- Przejrzyj arkusze w kolekcji i w każdej iteracji wykonaj następujące kroki:
- Uzyskaj odniesienie do arkusza w obiekcie.
- Uzyskaj liczbę wierszy i kolumn danych w arkuszu.
- Rozpocznij pętlę dla wierszy.
- Uruchom zagnieżdżoną pętlę dla kolumn.
- Odczytaj dane z każdej komórki za pomocą metody Worksheet.getCells().get(rowIndex, columnIndex).getValue().
Poniższy przykładowy kod pokazuje, jak odczytać plik programu Excel w języku Python.
# Załaduj skoroszyt programu Excel
wb = Workbook("workbook.xlsx")
# Pobierz kolekcję arkuszy roboczych
collection = wb.getWorksheets()
collectionCount = collection.getCount()
# Przejrzyj w pętli wszystkie arkusze
for worksheetIndex in range(collectionCount):
# Pobierz arkusz roboczy, korzystając z jego indeksu
worksheet = collection.get(worksheetIndex)
# Wydrukuj nazwę arkusza
print("Worksheet: " + str(worksheet.getName()))
# Uzyskaj liczbę wierszy i kolumn
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()
# Zapętlaj rzędy
for i in range(rows):
# Przejdź przez każdą kolumnę w wybranym rzędzie
for j in range(cols):
# Wydrukuj wartość komórki
print(worksheet.getCells().get(i, j).getValue(), end =" | ")
# Przerwa w linii wydruku
print("\n")
Poniżej przedstawiono dane wyjściowe, które otrzymujemy po uruchomieniu powyższego przykładowego kodu.
Przeczytaj określony arkusz kalkulacyjny w Excelu w Python
Możesz także przeczytać określony arkusz w pliku Excel, wykonując poniższe czynności.
- Załaduj plik Excela, używając klasy Workbook.
- Uzyskaj odniesienie do żądanego arkusza za pomocą metody Workbook.getWorksheets().get(index).
- Uzyskaj liczbę wierszy i kolumn danych w arkuszu.
- Rozpocznij pętlę dla wierszy.
- Uruchom zagnieżdżoną pętlę dla kolumn.
- Odczytaj dane z każdej komórki za pomocą metody Worksheet.getCells().get(rowIndex, columnIndex).getValue().
Poniższy przykładowy kod pokazuje, jak odczytywać dane z określonego arkusza w języku Python.
# Załaduj skoroszyt programu Excel
wb = Workbook("workbook.xlsx")
# Pobierz kolekcję arkuszy roboczych
worksheet = wb.getWorksheets().get(0)
# Wydrukuj nazwę arkusza
print("Worksheet: " + str(worksheet.getName()))
# Uzyskaj liczbę wierszy i kolumn
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()
# Zapętlaj rzędy
for i in range(rows):
# Przejdź przez każdą kolumnę w wybranym rzędzie
for j in range(cols):
# wydrukuj wartość komórki
print(worksheet.getCells().get(i, j).getValue(), end =" | ")
# Przerwa w linii wydruku
print("\n")
Uzyskaj bezpłatną licencję API
Możesz używać Aspose.Cells for Python przez Javę bez ograniczeń ewaluacyjnych, prosząc o darmową licencję tymczasową.
Wniosek
W tym artykule nauczyłeś się czytać pliki Excela w Python. Ponadto widziałeś, jak odczytywać dane z określonego arkusza lub wszystkich arkuszy w skoroszycie programu Excel. Możesz dowiedzieć się więcej o bibliotece arkuszy kalkulacyjnych Python, korzystając z dokumentacji. Jeśli masz jakieś pytania lub wątpliwości, daj nam znać za pośrednictwem naszego forum.