Các trang web thường chứa dữ liệu dạng bảng, chẳng hạn như báo cáo, danh sách giá hoặc thống kê, được định dạng trong các bảng HTML.Làm việc với dữ liệu web thường yêu cầu chuyển đổi các bảng hoặc trang HTML thành bảng tính Excel để phân tích hoặc báo cáo. Xuất khẩu chúng sang Excel cho phép sắp xếp, lọc và tính toán. Tự động hóa quy trình này bằng Python đảm bảo độ chính xác và tiết kiệm thời gian, đặc biệt là khi xử lý các bộ dữ liệu lớn hoặc lặp đi lặp lại. Trong hướng dẫn này, bạn sẽ học cách chuyển đổi HTML thành Excel trong Python chỉ với một vài dòng mã.

Thư viện chuyển đổi Python HTML sang Excel

Aspose.Cells for Python via .NET là một thư viện tự động hóa bảng tính hiệu suất cao cho phép các nhà phát triển Python tạo, chỉnh sửa và chuyển đổi các tệp Excel mà không cần sử dụng Microsoft Excel.

Nó hỗ trợ đọc và ghi nhiều định dạng khác nhau, bao gồm XLS, XLSX, CSV, HTML, ODS, và nhiều hơn nữa. Các nhà phát triển cũng có thể thao tác với công thức, áp dụng định dạng, chèn biểu đồ và xử lý các bảng tính phức tạp theo chương trình. Sự linh hoạt này khiến nó trở nên lý tưởng cho các tác vụ tự động hóa như chuyển đổi báo cáo HTML, hóa đơn hoặc bảng thành các sổ làm việc Excel để xử lý hoặc phân phối thêm.

Trước khi viết mã, hãy tải nó từ releases hoặc cài đặt gói từ PyPI.Chạy lệnh sau trong terminal của bạn:

pip install aspose-cells-python 

Điều này cài đặt API và các phụ thuộc của nó, cho phép sử dụng trong bất kỳ dự án Python nào.

Chuyển đổi HTML sang Excel trong Python

Aspose.Cells cho phép chuyển đổi trực tiếp một tệp HTML hoặc chuỗi thành một sổ làm việc Excel. Bạn có thể sau đó lưu nó dưới định dạng XLSX, XLS hoặc các định dạng được hỗ trợ khác.

Làm theo các bước dưới đây để tải HTML và lưu dưới dạng Excel:

  1. Tải tệp HTML bằng cách sử dụng lớp Workbook.
  2. Lưu sổ làm việc dưới định dạng XLSX.

Mẫu mã sau đây tải một tệp HTML và xuất nó sang định dạng Excel trong Python.

from aspose.cells import Workbook

# Bước 1: Định nghĩa đường dẫn tệp HTML đầu vào
input_file = "sample.html"

# Bước 2: Tạo một đối tượng Workbook và tải HTML
workbook = Workbook(input_file)

# Bước 3: Lưu tệp dưới dạng Excel
workbook.save("output.xlsx")
Chuyển đổi HTML sang Excel bằng Python

Chuyển đổi HTML sang Excel bằng Python.

Chuyển chuỗi HTML sang Excel

Đôi khi nội dung HTML có sẵn trong bộ nhớ thay vì trên tập tin. Aspose.Cells cho phép bạn chuyển đổi các chuỗi HTML trực tiếp mà không cần lưu chúng trước. Phương pháp này hoàn hảo để chuyển đổi nội dung HTML động thành các tập tin Excel ngay lập tức, chẳng hạn như trong việc thu thập dữ liệu trên web hoặc các kịch bản trích xuất dữ liệu.

Làm theo các bước dưới đây để chuyển đổi một chuỗi HTML thành Excel:

  1. Khởi tạo workbook bằng cách sử dụng một luồng bộ nhớ chứa nội dung HTML.
  2. Lưu kết quả dưới dạng tệp Excel.

Mẫu mã sau đây cho thấy cách xuất một chuỗi HTML vào một bảng tính Excel:

from aspose.cells import Workbook, HtmlLoadOptions
from io import BytesIO

# Bước 1: Định nghĩa chuỗi HTML
html_data = """
<table border='1'>
<tr><th>Product</th><th>Price</th><th>Quantity</th></tr>
<tr><td>Laptop</td><td>800</td><td>5</td></tr>
<tr><td>Phone</td><td>400</td><td>10</td></tr>
</table>
"""

# Bước 2: Chuyển đổi chuỗi HTML thành byte
html_bytes = BytesIO(html_data.encode('utf-8'))

# Bước 3: Tải HTML từ bộ nhớ
options = HtmlLoadOptions()
workbook = Workbook(html_bytes, options)

# Bước 4: Lưu dưới dạng Excel
workbook.save("from_string.xlsx")
Chuyển đổi chuỗi HTML sang Excel bằng Python

Chuyển đổi chuỗi HTML sang Excel bằng Python.

Tùy chọn nâng cao cho chuyển đổi HTML sang Excel

Aspose.Cells cung cấp điều khiển nâng cao về cách các tệp HTML của bạn được đọc và lưu. Bạn có thể sử dụng lớp HtmlLoadOptions để xử lý hình ảnh nhúng, định dạng hoặc mã hóa.

Làm theo các bước dưới đây để tùy chỉnh việc tải các tệp HTML:

  1. Tạo một thể hiện của lớp HtmlLoadOptions.
  2. Xác định tùy chọn tải HTML.
  3. Tải HTML với các tùy chọn sử dụng lớp Workbook.
  4. Lưu dưới dạng Excel bằng cách sử dụng phương thức save().

Ví dụ mã sau sử dụng HtmlLoadOptions để xử lý HTML với các cài đặt cụ thể và lưu dưới dạng tệp Excel.

from aspose.cells import Workbook, HtmlLoadOptions

# Bước 1: Đặt tùy chọn tải HTML
load_options = HtmlLoadOptions()
load_options.auto_fit_cols_and_rows = True  # Automatically adjusts columns and rows

# Bước 2: Tải HTML với các tùy chọn
workbook = Workbook("sample.html", load_options)

# Bước 3: Lưu dưới dạng Excel
workbook.save("table_advanced.xlsx")
Chuyển đổi HTML thành Excel bằng Python - Tùy chọn Nâng cao

Tùy chọn nâng cao cho việc chuyển đổi HTML sang Excel.

Khi nào sử dụng các tùy chọn tải?

Sử dụng những lựa chọn này khi:

  • HTML của bạn bao gồm các bảng lớn hoặc các ô gộp.
  • Bạn muốn giữ nguyên độ rộng và kiểu của cột.
  • Bạn cần tự động điều chỉnh bố cục để cải thiện khả năng đọc.

Chuyển đổi HTML sang nhiều định dạng Excel

Aspose.Cells cho phép lưu đầu ra dưới các định dạng bảng tính khác nhau dựa trên yêu cầu của bạn. Nó cho phép tích hợp vào các pipeline dữ liệu, bảng điều khiển hoặc công cụ tự động hóa yêu cầu các định dạng xuất khác nhau.

from aspose.cells import Workbook

workbook = Workbook("sample.html")

# Lưu dưới định dạng XLS
workbook.save("output.xls")

# Lưu dưới định dạng CSV
workbook.save("output.csv")

# Lưu thành PDF để báo cáo
workbook.save("output.pdf")

Nhận Giấy phép Miễn phí

Đánh giá Aspose.Cells for Python qua .NET mà không có hạn chế. Yêu cầu một giấy phép tạm thời miễn phí từ trang Aspose License Page.Áp dụng nó trong mã của bạn để khám phá tất cả các tính năng cao cấp, từ xử lý tệp lớn đến định dạng nâng cao và thao tác biểu đồ.

Chuyển đổi HTML sang Excel Online

Nếu bạn muốn nhanh chóng chuyển đổi nội dung HTML của mình sang định dạng Excel mà không cần viết mã, hãy thử trình chuyển đổi HTML to Excel online converter của Aspose.Cells.

Trình chuyển đổi HTML sang Excel trực tuyến miễn phí
Input file
Output format
  

Ứng dụng web miễn phí này hoạt động trực tiếp trong trình duyệt của bạn và hỗ trợ nhiều định dạng, bao gồm HTML, XLS, XLSX, CSV và ODS. Bạn có thể tải lên một tệp, chọn định dạng đầu ra và tải xuống Excel được chuyển đổi ngay lập tức.

Python HTML to Excel: Tài nguyên miễn phí

Ngoài việc chuyển đổi HTML sang Excel, Aspose.Cells for Python thông qua .NET hỗ trợ chuyển đổi tệp, tạo biểu đồ, công thức, định dạng và bảng pivot. Các nhà phát triển có thể sử dụng nó để tạo hoặc xử lý các tệp Excel mà không cần Microsoft Office. Hãy sử dụng các tài nguyên sau để khám phá thêm các tính năng nâng cao:

Kết luận

Chuyển đổi HTML sang Excel trong Python là một cách mạnh mẽ để đưa dữ liệu từ web vào môi trường phân tích hoặc báo cáo của bạn. Với Aspose.Cells for Python, bạn có thể thực hiện việc chuyển đổi này chỉ với vài dòng mã trong khi vẫn giữ được độ chính xác, định dạng và hiệu suất. Dù bạn đang xây dựng một script xử lý dữ liệu hay tích hợp báo cáo web vào bảng điều khiển Excel, Aspose.Cells cung cấp cho bạn tất cả các công cụ bạn cần.

Có câu hỏi hoặc cần trợ giúp kỹ thuật? Ghé thăm Diễn đàn Hỗ trợ Miễn phí để kết nối trực tiếp với các chuyên gia của chúng tôi. Đội ngũ của chúng tôi sẵn sàng giúp bạn giải quyết vấn đề và hướng dẫn bạn qua dự án của mình.

Câu hỏi thường gặp (FAQs)

1. Tôi có thể chuyển đổi HTML trực tiếp sang Excel bằng Python không?

Có. Bạn có thể chuyển đổi bất kỳ tập tin HTML hoặc chuỗi chứa dữ liệu bảng trực tiếp sang Excel bằng cách sử dụng thư viện Aspose.Cells for Python qua .NET. Nó đọc cấu trúc HTML và giữ nguyên bảng, định dạng và kiểu trong tệp Excel đầu ra.

2. Aspose.Cells có hỗ trợ chuyển đổi chuỗi HTML sang Excel không?

Chắc chắn rồi. Bạn có thể tải nội dung HTML từ một chuỗi hoặc luồng bộ nhớ thay vì từ một tệp. Điều này rất hữu ích khi HTML được tạo động từ dữ liệu web, API hoặc đầu vào của người dùng.

3. Các định dạng đầu ra nào được hỗ trợ ngoài XLSX?

Ngoài XLSX, bạn có thể xuất HTML của mình sang XLS, CSV, ODS, PDF và các định dạng khác được Aspose.Cells hỗ trợ. Bạn chỉ cần chỉ định SaveFormat mong muốn khi lưu sổ làm việc.

4. Tôi có cần cài đặt Microsoft Excel để sử dụng Aspose.Cells không?

Không. Aspose.Cells là một thư viện Python độc lập không phụ thuộc vào Microsoft Excel hoặc Office. Bạn có thể thực hiện tất cả các chuyển đổi một cách lập trình trên bất kỳ hệ thống nào.

5. Có công cụ trực tuyến nào để chuyển đổi HTML sang Excel mà không cần lập trình không?

Vâng, Aspose cung cấp một trình chuyển đổi HTML sang Excel trực tuyến miễn phí nơi bạn có thể tải lên một tệp HTML và ngay lập tức tải xuống đầu ra Excel.

6. Aspose.Cells có thể xử lý các bảng HTML lớn hoặc phức tạp không?

Có. Aspose.Cells được thiết kế cho việc xử lý dữ liệu hiệu suất cao. Nó xử lý hiệu quả các tệp HTML lớn chứa nhiều bảng, hình ảnh hoặc bố cục phức tạp, đảm bảo kết quả Excel chính xác.

Xem Thêm