Từ sang PDF là một trong những chuyển đổi tài liệu phổ biến nhất và được thực hiện hiệu quả. Các tệp DOCX hoặc DOC được chuyển đổi sang định dạng PDF trước khi chúng được in hoặc chia sẻ. Trong bài viết này, chúng tôi sẽ tự động chuyển đổi Word sang PDF bằng Python. Các bước và mẫu mã sẽ trình bày cách chuyển Word DOCX hoặc DOC sang PDF bằng Python. Ngoài ra, bạn sẽ tìm hiểu về các tùy chọn khác nhau để tùy chỉnh chuyển đổi Word sang PDF.
- Thư viện Python cho Word Chuyển đổi DOCX sang PDF
- Chuyển đổi DOCX sang PDF bằng Python
- Python DOCX sang PDF với Tiêu chuẩn PDF cụ thể
- Chuyển đổi phạm vi trang trong tài liệu Word sang PDF
- Áp dụng Nén hình ảnh trong DOCX sang PDF
Thư viện Python cho Chuyển đổi Word sang PDF - Tải xuống miễn phí
Để chuyển đổi tài liệu Word sang định dạng PDF, chúng tôi sẽ sử dụng Aspose.Words dành cho Python. Nó là một thư viện Python giàu tính năng để tạo và thao tác các tài liệu Word. Hơn nữa, nó cho phép bạn chuyển đổi các tệp DOCX và DOC sang định dạng PDF với độ trung thực cao. Thư viện được lưu trữ trên PyPI và bạn có thể cài đặt nó bằng lệnh pip sau.
pip install aspose-words
Chuyển đổi Word DOCX sang PDF bằng Python
Sau đây là các bước để chuyển đổi tài liệu Word sang PDF bằng Python.
- Tải tài liệu Word bằng lớp Tài liệu.
- Chuyển đổi tài liệu Word sang PDF bằng phương thức Document.save().
Mẫu mã sau đây cho thấy cách chuyển đổi tệp Word DOCX sang PDF.
import aspose.words as aw
# Tải tài liệu từ
doc = aw.Document("calibre.docx")
# Lưu dưới dạng PDF
doc.save("PDF.pdf")
Từ Python sang PDF với một tiêu chuẩn cụ thể
Bạn cũng có thể chỉ định tiêu chuẩn cụ thể cho tài liệu PDF được chuyển đổi như PDF / A. Sau đây là các bước để chỉ định tiêu chuẩn PDF trong chuyển đổi Word sang PDF bằng Python.
- Tải tài liệu Word bằng lớp Tài liệu.
- Tạo một đối tượng của lớp PdfSaveOptions và đặt tiêu chuẩn PDF bằng thuộc tính PdfSaveOptions.compliance.
- Chuyển đổi tài liệu Word sang PDF bằng phương thức Document.save().
Mẫu mã sau đây cho thấy cách thiết lập một tiêu chuẩn cụ thể trong chuyển đổi Word DOCX sang PDF.
import aspose.words as aw
# Tải tài liệu từ
doc = aw.Document("calibre.docx")
# Tạo các tùy chọn lưu và đặt tính tuân thủ
saveOptions = aw.saving.PdfSaveOptions()
saveOptions.compliance = aw.saving.PdfCompliance.PDF17
# Lưu dưới dạng PDF
doc.save("PDF.pdf", saveOptions)
Python DOCX sang PDF - Chuyển đổi phạm vi trang
Bạn cũng có thể chỉ định phạm vi trang bạn muốn chuyển đổi sang định dạng PDF. Đối với điều này, bạn có thể sử dụng thuộc tính PdfSaveOptions.pageset. Mẫu mã sau đây cho thấy cách chuyển đổi một loạt các trang trong tài liệu Word sang PDF.
import aspose.words as aw
# Tải tài liệu từ
doc = aw.Document("calibre.docx")
# Tạo các tùy chọn lưu và đặt phạm vi trang
saveOptions = aw.saving.PdfSaveOptions()
saveOptions.page_set = aw.saving.PageSet([0, 1])
# Lưu dưới dạng PDF
doc.save("PDF.pdf", saveOptions)
DOC DOCX sang PDF bằng Python - Áp dụng Nén hình ảnh
Aspose.Words for Python cũng cho phép bạn áp dụng tính năng nén hình ảnh trong tài liệu PDF đã chuyển đổi. Ngoài ra, bạn có thể chỉ định chất lượng JPEG cho hình ảnh. Sau đây là các bước để đặt nén hình ảnh trong khi chuyển đổi Word DOCX sang PDF bằng Python.
- Tải tài liệu Word bằng lớp Tài liệu.
- Tạo một đối tượng của lớp PdfSaveOptions.
- Đặt nén hình ảnh bằng thuộc tính PdfSaveOptions.imagecompression.
- Đặt chất lượng JPEG bằng thuộc tính PdfSaveOptions.jpegquality.
- Chuyển đổi tài liệu Word sang PDF bằng phương thức Document.save().
Mẫu mã sau đây cho thấy cách thiết lập tính năng nén hình ảnh trong chuyển đổi Word sang PDF.
import aspose.words as aw
# Tải tài liệu từ
doc = aw.Document("calibre.docx")
# Tạo các tùy chọn lưu và đặt nén hình ảnh
saveOptions = aw.saving.PdfSaveOptions()
saveOptions.image_compression = aw.saving.PdfImageCompression.JPEG
saveOptions.jpeg_quality = 100 # Use JPEG compression at 50% quality to reduce file size.
# Lưu dưới dạng PDF
doc.save("PDF.pdf", saveOptions)
Python DOCX sang Thư viện PDF - Nhận Giấy phép Thư viện Miễn phí
Bạn có thể xin giấy phép tạm thời để sử dụng Aspose. AdWords for Python mà không có giới hạn đánh giá.
Sự kết luận
Trong bài viết này, bạn đã học cách chuyển đổi tệp Word DOCX hoặc DOC sang PDF bằng Python. Hơn nữa, bạn đã thấy các tùy chọn khác nhau để tùy chỉnh chuyển đổi DOC hoặc DOCX sang PDF bằng Python. Bạn có thể tìm hiểu thêm về Aspose. AdWords for Python bằng tài liệu. Trong trường hợp bạn có bất kỳ câu hỏi nào, vui lòng cho chúng tôi biết qua diễn đàn của chúng tôi.
Xem thêm
Thông tin: Bạn có thể quan tâm đến một thư viện Python khác cho phép các nhà phát triển và ứng dụng chuyển đổi PowerPoint sang PDF - Aspose.Slides for Python. Và bạn cũng có thể muốn xem Aspose PowerPoint to PDF Converter vì nó là một triển khai trực tiếp của quá trình chuyển đổi PowerPoint sang PDF.