Chuyển đổi Word sang PDF trong Python

Từ sang PDF là một trong những chuyển đổi tài liệu phổ biến nhất và được thực hiện hiệu quả. Các tệp DOCX hoặc DOC được chuyển đổi sang định dạng PDF trước khi chúng được in hoặc chia sẻ. Trong bài viết này, chúng tôi sẽ tự động chuyển đổi Word sang PDF bằng Python. Các bước và mẫu mã sẽ trình bày cách chuyển Word DOCX hoặc DOC sang PDF bằng Python. Ngoài ra, bạn sẽ tìm hiểu về các tùy chọn khác nhau để tùy chỉnh chuyển đổi Word sang PDF.

Thư viện Python cho Chuyển đổi Word sang PDF - Tải xuống miễn phí

Để chuyển đổi tài liệu Word sang định dạng PDF, chúng tôi sẽ sử dụng Aspose.Words dành cho Python. Nó là một thư viện Python giàu tính năng để tạo và thao tác các tài liệu Word. Hơn nữa, nó cho phép bạn chuyển đổi các tệp DOCX và DOC sang định dạng PDF với độ trung thực cao. Thư viện được lưu trữ trên PyPI và bạn có thể cài đặt nó bằng lệnh pip sau.

pip install aspose-words

Chuyển đổi Word DOCX sang PDF bằng Python

Sau đây là các bước để chuyển đổi tài liệu Word sang PDF bằng Python.

  • Tải tài liệu Word bằng lớp Tài liệu.
  • Chuyển đổi tài liệu Word sang PDF bằng phương thức Document.save().

Mẫu mã sau đây cho thấy cách chuyển đổi tệp Word DOCX sang PDF.

import aspose.words as aw

# Tải tài liệu từ
doc = aw.Document("calibre.docx")

# Lưu dưới dạng PDF
doc.save("PDF.pdf")

Từ Python sang PDF với một tiêu chuẩn cụ thể

Bạn cũng có thể chỉ định tiêu chuẩn cụ thể cho tài liệu PDF được chuyển đổi như PDF / A. Sau đây là các bước để chỉ định tiêu chuẩn PDF trong chuyển đổi Word sang PDF bằng Python.

  • Tải tài liệu Word bằng lớp Tài liệu.
  • Tạo một đối tượng của lớp PdfSaveOptions và đặt tiêu chuẩn PDF bằng thuộc tính PdfSaveOptions.compliance.
  • Chuyển đổi tài liệu Word sang PDF bằng phương thức Document.save().

Mẫu mã sau đây cho thấy cách thiết lập một tiêu chuẩn cụ thể trong chuyển đổi Word DOCX sang PDF.

import aspose.words as aw

# Tải tài liệu từ
doc = aw.Document("calibre.docx")

# Tạo các tùy chọn lưu và đặt tính tuân thủ
saveOptions = aw.saving.PdfSaveOptions()
saveOptions.compliance = aw.saving.PdfCompliance.PDF17 

# Lưu dưới dạng PDF
doc.save("PDF.pdf", saveOptions)

Python DOCX sang PDF - Chuyển đổi phạm vi trang

Bạn cũng có thể chỉ định phạm vi trang bạn muốn chuyển đổi sang định dạng PDF. Đối với điều này, bạn có thể sử dụng thuộc tính PdfSaveOptions.pageset. Mẫu mã sau đây cho thấy cách chuyển đổi một loạt các trang trong tài liệu Word sang PDF.

import aspose.words as aw

# Tải tài liệu từ
doc = aw.Document("calibre.docx")

# Tạo các tùy chọn lưu và đặt phạm vi trang
saveOptions = aw.saving.PdfSaveOptions()
saveOptions.page_set = aw.saving.PageSet([0, 1])

# Lưu dưới dạng PDF
doc.save("PDF.pdf", saveOptions)

DOC DOCX sang PDF bằng Python - Áp dụng Nén hình ảnh

Aspose.Words for Python cũng cho phép bạn áp dụng tính năng nén hình ảnh trong tài liệu PDF đã chuyển đổi. Ngoài ra, bạn có thể chỉ định chất lượng JPEG cho hình ảnh. Sau đây là các bước để đặt nén hình ảnh trong khi chuyển đổi Word DOCX sang PDF bằng Python.

  • Tải tài liệu Word bằng lớp Tài liệu.
  • Tạo một đối tượng của lớp PdfSaveOptions.
  • Đặt nén hình ảnh bằng thuộc tính PdfSaveOptions.imagecompression.
  • Đặt chất lượng JPEG bằng thuộc tính PdfSaveOptions.jpegquality.
  • Chuyển đổi tài liệu Word sang PDF bằng phương thức Document.save().

Mẫu mã sau đây cho thấy cách thiết lập tính năng nén hình ảnh trong chuyển đổi Word sang PDF.

import aspose.words as aw

# Tải tài liệu từ
doc = aw.Document("calibre.docx")

# Tạo các tùy chọn lưu và đặt nén hình ảnh
saveOptions = aw.saving.PdfSaveOptions()
saveOptions.image_compression = aw.saving.PdfImageCompression.JPEG
saveOptions.jpeg_quality = 100 # Use JPEG compression at 50% quality to reduce file size.

# Lưu dưới dạng PDF
doc.save("PDF.pdf", saveOptions)

Python DOCX sang Thư viện PDF - Nhận Giấy phép Thư viện Miễn phí

Bạn có thể xin giấy phép tạm thời để sử dụng Aspose. AdWords for Python mà không có giới hạn đánh giá.

Sự kết luận

Trong bài viết này, bạn đã học cách chuyển đổi tệp Word DOCX hoặc DOC sang PDF bằng Python. Hơn nữa, bạn đã thấy các tùy chọn khác nhau để tùy chỉnh chuyển đổi DOC hoặc DOCX sang PDF bằng Python. Bạn có thể tìm hiểu thêm về Aspose. AdWords for Python bằng tài liệu. Trong trường hợp bạn có bất kỳ câu hỏi nào, vui lòng cho chúng tôi biết qua diễn đàn của chúng tôi.

Xem thêm

Chuyển PDF sang văn bản bằng PythonXLSX sang JSON trong JavaExcel sang JSON trong Java
DOCX sang JSON trong JavaDOC sang JSON trong JavaChuyển từ sang JSON trong Java
TXT sang JSON trong JavaJSON sang PDF bằng PythonExcel sang JSON trong Java
TXT sang JSON bằng PythonPNG sang Word trong C# .NETJPG sang Word trong C# .NET
Hình ảnh sang Word trong C#Chuyển từ sang HTML trong C#Word DOCX sang Markdown trong Java
Tạo tài liệu MS Word bằng PythonChuyển đổi tài liệu Word sang hình ảnh bằng PythonTạo tài liệu MS Word (DOC / DOCX) bằng C ++
Trích xuất hình ảnh từ Word DOC trong Java[Sao chép macro từ một tài liệu Word sang tài liệu khác trong Java](https://blog.aspose.com/2019/12/27/copy-word-macro-from-one-document-to-other-aspose-words-for -java /)[Chuyển Word sang PowerPoint] [https://blog.aspose.com/total/convert-doc-to-ppt-python/]

Thông tin: Bạn có thể quan tâm đến một thư viện Python khác cho phép các nhà phát triển và ứng dụng chuyển đổi PowerPoint sang PDF - Aspose.Slides for Python. Và bạn cũng có thể muốn xem Aspose PowerPoint to PDF Converter vì nó là một triển khai trực tiếp của quá trình chuyển đổi PowerPoint sang PDF.