Перетворення DOC DOCX на TXT на Python

Як програмісту вам може знадобитися обробити купу файлів Word DOC/DOCX, щоб витягти звичайний текст із програм Python. Ця стаття пропонує потужне, високоякісне та просте рішення для видобування простого тексту з файлів Word DOCX або DOC у Python. Зрештою, ви дізнаєтесь, як конвертувати файл DOCX або DOC у TXT у Python.

MS Word — популярна програма обробки текстів, яка дозволяє створювати документи у форматі форматованого тексту. У MS Word створюється широкий спектр документів, включаючи рахунки-фактури, технічну документацію, звіти тощо. Тож давайте подивимося, як виконати перетворення Word у TXT у Python.

Конвертер Python DOCX у TXT

Для перетворення Word у TXT ми використаємо Aspose.Words for Python. Це чудова бібліотека з широким набором функцій для роботи з популярними текстовими документами, включаючи DOC і DOCX. Бібліотека полегшує процес обробки та отримання тексту з документів Word. Ви також можете використовувати цю бібліотеку та безкоштовно конвертувати Word у TXT.

Ви можете використати таку команду pip, щоб установити Aspose.Words for Python у своїй програмі.

pip install aspose-words

Як конвертувати DOCX у TXT на Python

Aspose.Words for Python спрощує перетворення DOCX у TXT, яке можна виконати за кілька кроків, як зазначено нижче:

  • Завантажте файл DOCX з диска.
  • Збережіть DOCX у форматі TXT у потрібному місці.

Вам не потрібно аналізувати весь документ Word сторінка за сторінкою або рядок за рядком, щоб витягти з нього текст. Давайте тепер розглянемо, як виконати ці дії в Python, щоб перетворити файл DOCX у формат TXT.

Збережіть Word DOC як TXT у Python

Нижче наведено кроки для збереження файлу DOC або DOCX як TXT у Python.

  • Завантажте файл DOC за допомогою класу документа.
  • Збережіть DOC як TXT за допомогою методу Document.save(filePath) і передайте шлях до файлу як параметр.

У наведеному нижче прикладі коду показано, як перетворити DOC на TXT у Python.

import aspose.words as aw

# Завантажити файл DOC
doc = aw.Document("document.doc")

# Зберегти DOC як TXT
doc.save("doc-to-text.txt")

Безкоштовний конвертер Python DOC у TXT

Ви можете використовувати безкоштовну тимчасову ліцензію для конвертації файлів DOC у формат TXT без обмежень оцінки.

Ознайомтеся з конвертером Word у TXT

Ви можете відвідати документацію бібліотеки Python Word, щоб дослідити інші функції. Якщо у вас виникнуть запитання, не соромтеся повідомити нас через наш форум.

Висновок

У цій статті ви дізналися, як конвертувати файли DOC або DOCX у формат TXT у Python. За допомогою зразка коду ви побачили, як завантажувати та зберігати файли DOCX як TXT у потрібному місці в Python.

Дивись також