Chuyển đổi tài liệu Word sang EPUB bằng Python

EPUB là định dạng phổ biến được sử dụng cho các ấn phẩm điện tử được gọi là sách điện tử. Tệp EPUB có thể được đọc trên điện thoại thông minh, máy tính bảng, máy tính xách tay, v.v. Trong nhiều trường hợp, tệp MS Word được chuyển đổi thành EPUB để cung cấp tài liệu trên nhiều nền tảng trình đọc. Để thực hiện chuyển đổi này theo chương trình, bài viết này trình bày cách chuyển đổi tệp Word DOCX hoặc DOC sang EPUB bằng Python.

Thư viện Python cho Chuyển đổi Word sang EPUB

Để chuyển đổi các tệp DOCX hoặc DOC sang định dạng EPUB, chúng tôi sẽ sử dụng Aspose.Words for Python. Thư viện này cung cấp một loạt các tính năng để tạo và thao tác với các tài liệu Word. Ngoài ra, nó còn cho phép bạn chuyển đổi tài liệu Word sang các định dạng khác với độ trung thực cao. Có thể cài đặt Aspose.Words dành cho Python từ PyPI bằng lệnh pip sau.

pip install aspose-words 

Chuyển đổi tài liệu Word sang EPUB bằng Python

Sau đây là các bước để chuyển đổi tài liệu Word sang EPUB bằng Python.

  • Tải tài liệu Word bằng lớp Tài liệu.
  • Chuyển đổi Word sang EPUB bằng phương thức Document.save (string).

Mẫu mã sau đây cho thấy cách chuyển đổi tệp DOCX thành EPUB bằng Python.

import aspose.words as aw

# Tải tài liệu Word
doc = aw.Document("document.docx")

# Chuyển đổi tài liệu Word sang EPUB
doc.save("word-to-epub.epub")

Các tùy chọn bổ sung cho Word sang EPUB bằng Python

Aspose.Words for Python cũng cung cấp các tùy chọn bổ sung để tùy chỉnh chuyển đổi Word sang EPUB. Ví dụ: bạn có thể đặt một lược đồ mã hóa, bật hoặc tắt xuất thông tin tài liệu, v.v. Để chỉ định các tùy chọn này, lớp HtmlSaveOptions được sử dụng. Sau đây là các bước để đặt các tùy chọn này trong chuyển đổi Word sang EPUB.

  • Đầu tiên, tải tài liệu Word bằng lớp Tài liệu.
  • Tạo một thể hiện của lớp HtmlSaveOptions.
  • Đặt các tùy chọn mong muốn bằng đối tượng HtmlSaveOptions.
  • Cuối cùng, chuyển Word sang EPUB bằng phương thức Document.save (string, HtmlSaveOptions).

Mẫu mã sau đây cho thấy cách chỉ định các tùy chọn bổ sung trong chuyển đổi Word sang EPUB.

import aspose.words as aw

# Tải tài liệu Word
doc = aw.Document("document.docx")

# Tạo một đối tượng cho các tùy chọn lưu
saveOptions = aw.saving.HtmlSaveOptions()

# Đặt mã hóa mong muốn
saveOptions.encoding = "utf-8"

# Chỉ định các phần tử để tách HTML nội bộ tại. Điều này tạo ra một HTML mới trong EPUB 
# điều này cho phép bạn giới hạn kích thước của từng phần HTML. Điều này rất hữu ích cho những người đọc không thể đọc 
# Các tệp HTML lớn hơn một kích thước nhất định, ví dụ: 300kb.
saveOptions.document_split_criteria = aw.saving.DocumentSplitCriteria.HEADING_PARAGRAPH

# Cho phép xuất các thuộc tính tài liệu
saveOptions.export_document_properties = True

# Chỉ định định dạng lưu
saveOptions.save_format = aw.SaveFormat.EPUB

# Chuyển đổi tài liệu Word sang EPUB
doc.save("word-to-epub.epub", saveOptions)

Nhận giấy phép miễn phí

Bạn có thể nhận giấy phép tạm thời để sử dụng Aspose.Words dành cho Python mà không có giới hạn đánh giá.

Sự kết luận

Trong bài viết này, bạn đã học cách chuyển đổi tài liệu Word sang định dạng EPUB bằng Python. Hơn nữa, bạn đã thấy cách sử dụng các tùy chọn khác nhau để tùy chỉnh động chuyển đổi Word sang EPUB. Bên cạnh đó, bạn có thể khám phá tài liệu của Aspose.Words dành cho Python. Trong trường hợp bạn có bất kỳ câu hỏi nào, vui lòng cho chúng tôi biết qua diễn đàn của chúng tôi.

Xem thêm