MS Excel cung cấp một cách thuận tiện để lưu giữ và chia sẻ dữ liệu dưới dạng hàng và cột. Thông thường, các tệp Excel được sử dụng để lưu trữ các tập dữ liệu khổng lồ có hàng trăm và hàng nghìn bản ghi. Trong khi làm việc với các tệp Excel bằng Python, bạn có thể cần đọc dữ liệu từ mỗi ô trong trang tính. Để đạt được điều đó, bài viết này hướng dẫn cách đọc tệp Excel bằng Python. Bạn sẽ học cách đọc dữ liệu từ một trang tính hoặc tất cả các trang tính trong sổ làm việc Excel.
Thư viện Python để đọc tệp Excel
Để đọc dữ liệu từ sổ làm việc, chúng tôi sẽ sử dụng Aspose.Cells for Python qua Java. Đây là một thư viện Python mạnh mẽ và giàu tính năng để tạo các tệp MS Excel. Hơn nữa, nó cho phép bạn đọc và thao tác các tệp Excel hiện có một cách liền mạch. Bạn có thể tải xuống thư viện hoặc cài đặt nó bằng lệnh pip sau.
pip install aspose-cells
Đọc tệp Excel bằng Python
Trước khi bắt đầu đọc dữ liệu, chúng ta hãy có cái nhìn tổng quan về cách dữ liệu được quản lý trong tệp Excel. Tệp Excel được gọi là sổ làm việc hoạt động như một vùng chứa. Mỗi sổ làm việc chứa một hoặc nhiều trang tính và mọi trang tính đều bao gồm một số ô. Các ô này được xác định duy nhất bởi các hàng và cột. Vì vậy, để đọc dữ liệu từ một ô, bạn cần biết chỉ số hàng và cột của ô đó.
Sau đây là các bước để đọc tệp Excel và in dữ liệu của tệp đó bằng Python.
- Tải tệp Excel bằng lớp Workbook.
- Nhận tham chiếu của WorksheetCollection bằng phương thức Workbook.getWorksheets().
- Lặp qua các trang tính trong bộ sưu tập và trong mỗi lần lặp, hãy thực hiện các bước sau:
- Nhận tham chiếu của trang tính trong một đối tượng.
- Nhận số lượng hàng và cột dữ liệu trong trang tính.
- Bắt đầu một vòng lặp cho các hàng.
- Bắt đầu một vòng lặp lồng nhau cho các cột.
- Đọc dữ liệu từ mỗi ô bằng phương thức Worksheet.getCells(). Get (rowIndex, columnIndex) .getValue().
Mẫu mã sau đây cho thấy cách đọc tệp Excel bằng Python.
# Tải sổ làm việc Excel
wb = Workbook("workbook.xlsx")
# Nhận bộ sưu tập trang tính
collection = wb.getWorksheets()
collectionCount = collection.getCount()
# Lặp lại tất cả các trang tính
for worksheetIndex in range(collectionCount):
# Nhận trang tính bằng cách sử dụng chỉ mục của nó
worksheet = collection.get(worksheetIndex)
# In tên bảng tính
print("Worksheet: " + str(worksheet.getName()))
# Nhận số hàng và cột
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()
# Lặp qua các hàng
for i in range(rows):
# Lặp qua từng cột trong hàng đã chọn
for j in range(cols):
# In giá trị ô
print(worksheet.getCells().get(i, j).getValue(), end =" | ")
# In ngắt dòng
print("\n")
Sau đây là kết quả mà chúng ta nhận được sau khi chạy mẫu mã ở trên.
Đọc một trang tính cụ thể trong Excel bằng Python
Bạn cũng có thể đọc một trang tính cụ thể trong tệp Excel bằng cách làm theo các bước bên dưới.
- Tải tệp Excel bằng lớp Workbook.
- Nhận tham chiếu của trang tính mong muốn bằng phương thức Workbook.getWorksheets(). Get (index).
- Nhận số lượng hàng và cột dữ liệu trong trang tính.
- Bắt đầu một vòng lặp cho các hàng.
- Bắt đầu một vòng lặp lồng nhau cho các cột.
- Đọc dữ liệu từ mỗi ô bằng phương thức Worksheet.getCells(). Get (rowIndex, columnIndex) .getValue().
Mẫu mã sau đây cho thấy cách đọc dữ liệu từ một trang tính cụ thể bằng Python.
# Tải sổ làm việc Excel
wb = Workbook("workbook.xlsx")
# Nhận bộ sưu tập trang tính
worksheet = wb.getWorksheets().get(0)
# In tên bảng tính
print("Worksheet: " + str(worksheet.getName()))
# Nhận số hàng và cột
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()
# Lặp qua các hàng
for i in range(rows):
# Lặp qua từng cột trong hàng đã chọn
for j in range(cols):
# in giá trị ô
print(worksheet.getCells().get(i, j).getValue(), end =" | ")
# In ngắt dòng
print("\n")
Nhận giấy phép API miễn phí
Bạn có thể sử dụng Aspose.Cells for Python thông qua Java mà không bị giới hạn đánh giá bằng cách yêu cầu giấy phép tạm thời miễn phí.
Sự kết luận
Trong bài viết này, bạn đã học cách đọc tệp Excel bằng Python. Hơn nữa, bạn đã thấy cách đọc dữ liệu từ một trang tính cụ thể hoặc tất cả các trang tính trong sổ làm việc Excel. Bạn có thể khám phá thêm về thư viện bảng tính Python bằng cách sử dụng tài liệu. Trong trường hợp bạn có bất kỳ câu hỏi hoặc thắc mắc nào, vui lòng cho chúng tôi biết qua diễn đàn của chúng tôi.