Chuyển đổi HTML sang PNG, JPEG, BMP, GIF hoặc TIFF Image bằng Python

HTML(Ngôn ngữ đánh dấu siêu văn bản) là định dạng tệp hàng đầu cho các trang web được hỗ trợ bởi tất cả các trình duyệt. Nó thường được sử dụng để hiển thị dữ liệu và thông tin dưới dạng một trang web. Trong một số trường hợp nhất định, chúng tôi có thể cần chuyển đổi tài liệu HTML sang định dạng hình ảnh như JPG, PNG, TIFF, BMP, [GIF] 6, v.v. Trong bài viết này, chúng ta sẽ học cách chuyển đổi HTML sang ảnh PNG, JPEG, BMP, GIF hoặc TIFF bằng Python.

  1. API Python để chuyển đổi HTML sang hình ảnh
  2. Chuyển đổi HTML sang hình ảnh JPG
  3. Chuyển đổi HTML sang Hình ảnh PNG
  4. Chuyển đổi HTML sang BMP
  5. Chuyển đổi HTML sang ảnh GIF
  6. Chuyển đổi HTML sang hình ảnh TIFF
  7. Chuỗi HTML sang chuyển đổi hình ảnh

API Python để chuyển đổi HTML sang hình ảnh

Để chuyển đổi HTML sang các định dạng hình ảnh, chúng tôi sẽ sử dụng API Aspose.Words for Python. Đây là một giải pháp hoàn chỉnh để đọc và thao tác các tài liệu thuộc nhiều loại khác nhau theo lập trình trong các ứng dụng Python. Nó cho phép chúng tôi tạo, sửa đổi, chuyển đổi, hiển thị và in Microsoft Word (DOC, DOCX, ODT), PDF và Web (HTML, Markdown) tài liệu.

Vui lòng cài đặt API từ PyPI bằng lệnh pip sau trong bảng điều khiển:

> pip install aspose-words

Chuyển đổi HTML sang hình ảnh JPG bằng Python

Chúng tôi có thể dễ dàng chuyển đổi tài liệu HTML sang hình ảnh JPG bằng cách làm theo các bước dưới đây:

  1. Đầu tiên, tải tệp HTML bằng lớp Tài liệu.
  2. Theo tùy chọn, chỉ định các tùy chọn lưu hình ảnh bằng cách sử dụng đối tượng lớp ImageSaveOptions.
  3. Tiếp theo, lặp qua tất cả các trang trong tài liệu.
  4. Sau đó, giải nén từng trang bằng phương thức extractpages().
  5. Cuối cùng, lưu trang dưới dạng JPG bằng cách sử dụng phương thức save().

Mẫu mã sau đây cho thấy cách chuyển đổi hình ảnh HTML sang JPG bằng Python.

# Ví dụ mã này trình bày cách chuyển đổi tài liệu HTML sang hình ảnh JPG.
import aspose.words as aw

# Tải tài liệu Word hiện có
doc = aw.Document("C:\\Files\\sample.html")

# Chỉ định các tùy chọn lưu hình ảnh
# Đặt định dạng lưu dưới dạng JPEG
imageOptions = aw.saving.ImageSaveOptions(aw.SaveFormat.JPEG)

# Đặt thuộc tính "JpegQuality" thành "10" để sử dụng tính năng nén mạnh hơn khi kết xuất tài liệu.
# Điều này sẽ làm giảm kích thước tệp của tài liệu, nhưng hình ảnh sẽ hiển thị các tạo tác nén nổi bật hơn.
imageOptions.jpeg_quality = 10

# Thay đổi độ phân giải ngang.
# Giá trị mặc định cho các thuộc tính này là 96.0, cho độ phân giải 96dpi.
# Tương tự, thay đổi độ phân giải dọc bằng cách đặt vertical_resolution 
imageOptions.horizontal_resolution = 72

# Lưu các trang dưới dạng JPG
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"C:\\Files\\Images\\Page_{page + 1}.jpg", imageOptions)
Chuyển đổi HTML sang hình ảnh JPG / JPEG bằng Python

Chuyển đổi HTML sang Hình ảnh PNG bằng Python

Chúng tôi có thể chuyển đổi tài liệu HTML sang hình ảnh PNG bằng cách làm theo các bước dưới đây:

  1. Đầu tiên, tải tệp HTML bằng lớp Tài liệu.
  2. Tiếp theo, tạo một thể hiện của lớp ImageSaveOptions.
  3. Sau đó, chỉ định các tùy chọn lưu hình ảnh như độ sáng hình ảnh, độ sáng tạo hình ảnh.
  4. Tiếp theo, lặp qua tất cả các trang trong tài liệu.
  5. Sau đó, giải nén từng trang bằng phương thức extractpages().
  6. Cuối cùng, lưu trang dưới dạng JPG bằng cách sử dụng phương thức save().

Mẫu mã sau đây cho thấy cách chuyển đổi HTML sang hình ảnh PNG trong Python.

# Ví dụ mã này trình bày cách chuyển đổi tài liệu HTML sang hình ảnh PNG.
import aspose.words as aw

# Tải tài liệu Word hiện có
doc = aw.Document("C:\\Files\\sample.html")

# Chỉ định các tùy chọn lưu hình ảnh
# Đặt định dạng lưu dưới dạng PNG
imageOptions = aw.saving.ImageSaveOptions(aw.SaveFormat.PNG)

# Thay đổi độ sáng và độ tương phản của hình ảnh.
# Cả hai đều trên thang điểm 0-1 và ở mức 0,5 theo mặc định.
imageOptions.image_brightness = 0.3
imageOptions.image_contrast = 0.7

# Lưu các trang dưới dạng PNG
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"C:\\Files\\Images\\Page_{page + 1}.png", imageOptions)

Chuyển đổi HTML sang BMP bằng Python

Chúng tôi có thể chuyển đổi tài liệu HTML sang hình ảnh BMP bằng cách làm theo các bước dưới đây:

  1. Đầu tiên, tải tệp HTML bằng lớp Tài liệu.
  2. Tiếp theo, lặp qua tất cả các trang trong tài liệu.
  3. Sau đó, giải nén từng trang bằng phương thức extractpages().
  4. Cuối cùng, lưu trang dưới dạng JPG bằng cách sử dụng phương thức save().

Mẫu mã sau đây cho thấy cách chuyển đổi HTML sang hình ảnh BMP trong Python.

# Ví dụ mã này trình bày cách chuyển đổi tài liệu HTML sang hình ảnh BMP.
import aspose.words as aw

# Tải tài liệu Word hiện có
doc = aw.Document("C:\\Files\\sample.html")

# Lưu các trang dưới dạng BMP
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"C:\\Files\\Images\\Page_{page + 1}.bmp")

Chuyển đổi HTML sang ảnh GIF bằng Python

Tương tự, chúng ta cũng có thể chuyển đổi tài liệu HTML sang ảnh GIF bằng cách làm theo các bước đã đề cập trước đó. Tuy nhiên, chúng ta chỉ cần lưu ảnh dưới dạng GIF với phần mở rộng “.gif” ở bước # 4.

Mẫu mã sau đây cho thấy cách chuyển đổi HTML sang ảnh GIF trong Python.

# Ví dụ mã này trình bày cách chuyển đổi tài liệu HTML sang ảnh GIF.
import aspose.words as aw

# Tải tài liệu Word hiện có
doc = aw.Document("C:\\Files\\sample.html")

# Lưu các trang dưới dạng GIF
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"C:\\Files\\Images\\Page_{page + 1}.gif")

Chuyển đổi HTML sang TIFF Image bằng Python

Chúng tôi cũng có thể chuyển đổi tài liệu HTML sang hình ảnh TIFF bằng cách làm theo các bước dưới đây:

  1. Tải tệp HTML bằng lớp Tài liệu.
  2. Lưu tài liệu dưới dạng TIFF bằng phương thức save().

Mẫu mã sau đây cho thấy cách chuyển đổi tài liệu HTML sang hình ảnh TIFF bằng Python.

# Ví dụ mã này trình bày cách chuyển đổi tài liệu HTML sang hình ảnh TIFF.
import aspose.words as aw

# Tải tài liệu Word hiện có
doc = aw.Document("C:\\Files\\sample.html")

# Lưu tài liệu dưới dạng TIFF
doc.save(f"C:\\Files\\Images\\Output.tiff")
Chuyển đổi HTML sang hình ảnh TIFF bằng Python

Chuyển đổi chuỗi HTML sang hình ảnh bằng Python

Chúng tôi có thể tạo động một tệp hình ảnh từ một chuỗi HTML bằng cách làm theo các bước dưới đây:

  1. Đầu tiên, tạo một thể hiện của lớp Tài liệu.
  2. Tiếp theo, tạo một thể hiện của lớp DocumentBuilder.
  3. Sau đó, chèn chuỗi HTML bằng phương thức insertthtml().
  4. Cuối cùng, lưu tài liệu dưới dạng JPG bằng phương thức save().

Mẫu mã sau đây cho thấy cách chuyển đổi một chuỗi HTML thành hình ảnh JPG bằng Python.

# Ví dụ mã này trình bày cách chuyển đổi chuỗi HTML thành hình ảnh.
import aspose.words as aw

# Tạo đối tượng tài liệu
doc = aw.Document()

# Tạo một đối tượng trình tạo tài liệu
builder = aw.DocumentBuilder(doc)

# Chèn HTML
builder.insert_html("<ul>\r\n" +
    "<li>Item1</li>\r\n" +
    "<li>Item2</li>\r\n" +
    "</ul>")

# Lưu tài liệu dưới dạng JPG
doc.save(f"C:\\Files\\Output.jpg")
Chuyển đổi chuỗi HTML thành hình ảnh bằng Python

Nhận giấy phép miễn phí

Bạn có thể nhận giấy phép tạm thời miễn phí để dùng thử Aspose. AdWords for Python mà không có giới hạn đánh giá.

Sự kết luận

Trong bài viết này, chúng tôi đã học cách:

  • chuyển đổi tài liệu HTML sang hình ảnh theo lập trình;
  • chuyển đổi nội dung của tệp HTML thành hình ảnh PNG, JPEG, BMP, GIF hoặc TIFF;
  • tạo một tài liệu HTML và chuyển đổi nó thành một hình ảnh bằng Python.

Ngoài ra, bạn có thể tìm hiểu thêm về API bằng cách sử dụng tài liệu. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn.

Xem thêm