Як програмісту вам може знадобитися обробити купу файлів Word DOC/DOCX, щоб витягти звичайний текст із програм Python. Ця стаття пропонує потужне, високоякісне та просте рішення для видобування простого тексту з файлів Word DOCX або DOC у Python. Зрештою, ви дізнаєтесь, як конвертувати файл DOCX або DOC у TXT у Python.
MS Word — популярна програма обробки текстів, яка дозволяє створювати документи у форматі форматованого тексту. У MS Word створюється широкий спектр документів, включаючи рахунки-фактури, технічну документацію, звіти тощо. Тож давайте подивимося, як виконати перетворення Word у TXT у Python.
- Конвертер Python DOCX у TXT — безкоштовно завантажити
- Кроки для перетворення DOCX на TXT на Python
- Збережіть DOC як файл TXT у Python
Конвертер Python DOCX у TXT
Для перетворення Word у TXT ми використаємо Aspose.Words for Python. Це чудова бібліотека з широким набором функцій для роботи з популярними текстовими документами, включаючи DOC і DOCX. Бібліотека полегшує процес обробки та отримання тексту з документів Word. Ви також можете використовувати цю бібліотеку та безкоштовно конвертувати Word у TXT.
Ви можете використати таку команду pip, щоб установити Aspose.Words for Python у своїй програмі.
pip install aspose-words
Як конвертувати DOCX у TXT на Python
Aspose.Words for Python спрощує перетворення DOCX у TXT, яке можна виконати за кілька кроків, як зазначено нижче:
- Завантажте файл DOCX з диска.
- Збережіть DOCX у форматі TXT у потрібному місці.
Вам не потрібно аналізувати весь документ Word сторінка за сторінкою або рядок за рядком, щоб витягти з нього текст. Давайте тепер розглянемо, як виконати ці дії в Python, щоб перетворити файл DOCX у формат TXT.
Збережіть Word DOC як TXT у Python
Нижче наведено кроки для збереження файлу DOC або DOCX як TXT у Python.
- Завантажте файл DOC за допомогою класу документа.
- Збережіть DOC як TXT за допомогою методу Document.save(filePath) і передайте шлях до файлу як параметр.
У наведеному нижче прикладі коду показано, як перетворити DOC на TXT у Python.
import aspose.words as aw
# Завантажити файл DOC
doc = aw.Document("document.doc")
# Зберегти DOC як TXT
doc.save("doc-to-text.txt")
Безкоштовний конвертер Python DOC у TXT
Ви можете використовувати безкоштовну тимчасову ліцензію для конвертації файлів DOC у формат TXT без обмежень оцінки.
Ознайомтеся з конвертером Word у TXT
Ви можете відвідати документацію бібліотеки Python Word, щоб дослідити інші функції. Якщо у вас виникнуть запитання, не соромтеся повідомити нас через наш форум.
Висновок
У цій статті ви дізналися, як конвертувати файли DOC або DOCX у формат TXT у Python. За допомогою зразка коду ви побачили, як завантажувати та зберігати файли DOCX як TXT у потрібному місці в Python.