Hình mờ trong tệp PDF được sử dụng để chèn biểu trưng, nhãn hiệu hoặc một đoạn văn bản trên trang. Mục đích của thủy ấn có thể là bảo vệ thông tin bí mật, khẳng định bản quyền, v.v. Trong khi xử lý các tệp PDF theo chương trình, bạn thường phải xóa các hình mờ được thêm vào các trang PDF. Để thực hiện điều đó, bài viết này chỉ cho bạn cách xóa hình mờ khỏi PDF bằng Python.
- Thư viện Python để xóa hình mờ trong PDF
- Xóa hình mờ khỏi PDF bằng Python
- Công cụ đánh dấu PDF trực tuyến
Thư viện Python để xóa hình mờ trong PDF
Để xóa hình mờ khỏi tệp PDF, chúng tôi sẽ sử dụng Aspose.PDF for Python. Đây là một thư viện thao tác PDF mạnh mẽ cho phép bạn thêm và xóa hình mờ PDF trong một vài bước đơn giản. Bạn có thể cài đặt thư viện bằng cách sử dụng lệnh pip sau đây.
pip install aspose-pdf
Xóa hình mờ khỏi PDF bằng Python
Trong tệp PDF, các hình mờ được thể hiện dưới dạng tạo tác. Do đó, để xóa hình mờ, chúng tôi sẽ phải truy cập vào các thành phần lạ trên mỗi trang của PDF. Sau đây là các bước để xóa hình mờ khỏi PDF bằng Python.
- Đầu tiên, tải tệp PDF bằng lớp Tài liệu.
- Sau đó, tạo một mảng để giữ các tham chiếu của các tạo phẩm cần xóa.
- Lặp lại từng trang của PDF bằng cách sử dụng bộ sưu tập Document.pages và trong mỗi lần lặp lại, hãy thực hiện các bước sau:
- Truy cập từng tạo phẩm của trang từ bộ sưu tập Page.artifacts.
- Kiểm tra xem loại tạo phẩm có phải là Artifact.artifactsubtype.WATERMARK hay không.
- Nếu có, hãy thêm tạo tác vào mảng.
- Cuối cùng, lặp qua các tạo phẩm cần xóa và xóa từng tạo phẩm bằng phương thức Page.artifacts.delete().
- Cuối cùng, lưu tệp PDF đã cập nhật bằng phương thức Document.save().
Mẫu mã sau đây cho biết cách xóa hình mờ khỏi PDF bằng Python.
import aspose.pdf as ap
# Tải tệp PDF
document = ap.Document("watermarked.pdf")
# Tạo một mảng để giữ hình mờ
artifactsToBeDeleted = []
# Lặp qua tất cả các trang
for page in document.pages:
# Truy cập từng hiện vật trong trang
for item in page.artifacts:
# Kiểm tra xem tạo phẩm có phải là hình mờ không
if item.sub_type == ap.Artifact.artifact_subtype.WATERMARK:
# Giữ tham chiếu trong mảng
artifactsToBeDeleted.add(item)
# Lặp lại các tạo tác hình mờ
for item in artifactsToBeDeleted:
# Xóa hiện vật
page.artifacts.delete(item)
# Lưu tệp PDF kết quả
document.save("Output.pdf")
Hình mờ tệp PDF trực tuyến
Hãy dùng thử công cụ trực tuyến miễn phí dành cho hình mờ PDF của chúng tôi, được phát triển bằng Aspose.PDF. Bạn có thể sử dụng công cụ này mà không cần tạo tài khoản.
Nhận giấy phép miễn phí
Nhận giấy phép tạm thời miễn phí và dùng thử tính năng xóa hình mờ mà không có bất kỳ giới hạn nào.
Khám phá thư viện Python PDF
Khám phá các tính năng khác của Aspose.PDF for Python bằng tài liệu. Trong trường hợp bạn có bất kỳ câu hỏi hoặc thắc mắc nào, hãy cho chúng tôi biết qua diễn đàn của chúng tôi.
Phần kết luận
Trong bài viết này, bạn đã học cách xóa hình mờ khỏi tệp PDF bằng Python. Hướng dẫn chi tiết và mẫu mã Python đã trình bày cách truy cập và xóa hình mờ khỏi mỗi trang trong tệp PDF. Ngoài ra, chúng tôi đã cung cấp cho bạn một công cụ đánh dấu mờ PDF dựa trên web miễn phí mà bạn có thể sử dụng miễn phí mọi lúc, mọi nơi.