Xóa hình mờ thành PDF bằng Python

Hình mờ trong tệp PDF được sử dụng để chèn biểu trưng, nhãn hiệu hoặc một đoạn văn bản trên trang. Mục đích của thủy ấn có thể là bảo vệ thông tin bí mật, khẳng định bản quyền, v.v. Trong khi xử lý các tệp PDF theo chương trình, bạn thường phải xóa các hình mờ được thêm vào các trang PDF. Để thực hiện điều đó, bài viết này chỉ cho bạn cách xóa hình mờ khỏi PDF bằng Python.

Thư viện Python để xóa hình mờ trong PDF

Để xóa hình mờ khỏi tệp PDF, chúng tôi sẽ sử dụng Aspose.PDF for Python. Đây là một thư viện thao tác PDF mạnh mẽ cho phép bạn thêm và xóa hình mờ PDF trong một vài bước đơn giản. Bạn có thể cài đặt thư viện bằng cách sử dụng lệnh pip sau đây.

pip install aspose-pdf

Xóa hình mờ khỏi PDF bằng Python

Trong tệp PDF, các hình mờ được thể hiện dưới dạng tạo tác. Do đó, để xóa hình mờ, chúng tôi sẽ phải truy cập vào các thành phần lạ trên mỗi trang của PDF. Sau đây là các bước để xóa hình mờ khỏi PDF bằng Python.

  • Đầu tiên, tải tệp PDF bằng lớp Tài liệu.
  • Sau đó, tạo một mảng để giữ các tham chiếu của các tạo phẩm cần xóa.
  • Lặp lại từng trang của PDF bằng cách sử dụng bộ sưu tập Document.pages và trong mỗi lần lặp lại, hãy thực hiện các bước sau:
    • Truy cập từng tạo phẩm của trang từ bộ sưu tập Page.artifacts.
    • Kiểm tra xem loại tạo phẩm có phải là Artifact.artifactsubtype.WATERMARK hay không.
    • Nếu có, hãy thêm tạo tác vào mảng.
  • Cuối cùng, lặp qua các tạo phẩm cần xóa và xóa từng tạo phẩm bằng phương thức Page.artifacts.delete().
  • Cuối cùng, lưu tệp PDF đã cập nhật bằng phương thức Document.save().

Mẫu mã sau đây cho biết cách xóa hình mờ khỏi PDF bằng Python.

import aspose.pdf as ap

# Tải tệp PDF
document = ap.Document("watermarked.pdf")

# Tạo một mảng để giữ hình mờ
artifactsToBeDeleted = []

# Lặp qua tất cả các trang
for page in document.pages:

    # Truy cập từng hiện vật trong trang
   for item in page.artifacts:

        # Kiểm tra xem tạo phẩm có phải là hình mờ không
        if item.sub_type == ap.Artifact.artifact_subtype.WATERMARK:

            # Giữ tham chiếu trong mảng
            artifactsToBeDeleted.add(item)

    # Lặp lại các tạo tác hình mờ
   for item in artifactsToBeDeleted:
        # Xóa hiện vật
        page.artifacts.delete(item)

# Lưu tệp PDF kết quả
document.save("Output.pdf")

Hình mờ tệp PDF trực tuyến

Hãy dùng thử công cụ trực tuyến miễn phí dành cho hình mờ PDF của chúng tôi, được phát triển bằng Aspose.PDF. Bạn có thể sử dụng công cụ này mà không cần tạo tài khoản.

Nhận giấy phép miễn phí

Nhận giấy phép tạm thời miễn phí và dùng thử tính năng xóa hình mờ mà không có bất kỳ giới hạn nào.

Khám phá thư viện Python PDF

Khám phá các tính năng khác của Aspose.PDF for Python bằng tài liệu. Trong trường hợp bạn có bất kỳ câu hỏi hoặc thắc mắc nào, hãy cho chúng tôi biết qua diễn đàn của chúng tôi.

Phần kết luận

Trong bài viết này, bạn đã học cách xóa hình mờ khỏi tệp PDF bằng Python. Hướng dẫn chi tiết và mẫu mã Python đã trình bày cách truy cập và xóa hình mờ khỏi mỗi trang trong tệp PDF. Ngoài ra, chúng tôi đã cung cấp cho bạn một công cụ đánh dấu mờ PDF dựa trên web miễn phí mà bạn có thể sử dụng miễn phí mọi lúc, mọi nơi.

Xem thêm