Chuyển đổi DOCX sang TXT bằng Python

Định dạng MS Word DOCDOCX thường được sử dụng để tạo tài liệu văn bản đa dạng thức. Bạn có thể thêm văn bản, bảng, đồ họa, hoạt ảnh và nhiều yếu tố khác vào tài liệu DOC / DOCX. Tuy nhiên, trong một số trường hợp nhất định, chẳng hạn như để phân tích cú pháp và phân tích văn bản trong tài liệu Word, bạn phải chuyển đổi tệp DOC / DOCX sang định dạng TXT theo lập trình. Để đạt được điều đó, bài viết này trình bày cách chuyển đổi tệp DOC hoặc DOCX sang định dạng TXT trong Python.

Thư viện chuyển đổi Python DOC / DOCX sang TXT

Để lưu các tệp DOC và DOCX ở định dạng TXT, chúng tôi sẽ sử dụng Aspose.Words for Python. Đây là một thư viện mạnh mẽ và tốc độ cao cung cấp một loạt các tính năng để tạo và thao tác các tài liệu văn bản một cách liền mạch. Ngoài ra, nó còn cung cấp khả năng chuyển đổi tài liệu sang các định dạng khác chất lượng cao. Bạn có thể cài đặt thư viện trong ứng dụng Python của mình từ PyPI bằng cách sử dụng lệnh pip sau.

> pip install aspose-words

Chuyển đổi DOCX sang TXT bằng Python

Hãy xem cách chuyển đổi tệp DOCX sang TXT bằng Python. Đối với điều này, bạn chỉ cần tải tệp DOCX và lưu nó dưới dạng tệp TXT. Sau đây là các bước để lưu tệp DOCX ở định dạng TXT trong Python.

  • Tải tệp DOCX bằng lớp Tài liệu.
  • Lưu DOCX dưới dạng TXT bằng phương thức Document.save().

Mẫu mã sau đây cho thấy cách thực hiện chuyển đổi DOCX sang TXT trong Python.

import aspose.words as aw

# Tải tài liệu DOC / DOCX
doc = aw.Document("Input.docx")

# Lưu dưới dạng TXT
doc.save("Output.txt")

Nhận giấy phép miễn phí

Bạn có thể nhận giấy phép tạm thời miễn phí để sử dụng Aspose. AdWords dành cho Python mà không có giới hạn đánh giá.

Sự kết luận

Trong bài viết này, bạn đã học cách chuyển đổi tệp DOC hoặc DOCX sang định dạng TXT trong Python. Tính năng này cho phép bạn trích xuất văn bản từ các tệp DOCX và lưu nó dưới dạng tệp TXT thuần túy. Nhờ đó, bạn có thể phân tích văn bản thuận tiện hơn. Ngoài ra, bạn có thể tìm hiểu thêm về thư viện bằng cách sử dụng tài liệu. Ngoài ra, bạn có thể chia sẻ câu hỏi hoặc thắc mắc của mình qua diễn đàn của chúng tôi.

Xem thêm