Artikel ini memberikan cara paling sederhana untuk mengekstraksi teks biasa dari file Word DOCX atau DOC di aplikasi Python Anda. Setelah membaca artikel ini, Anda akan mempelajari cara mengonversi file DOCX atau DOC menjadi TXT dengan Python.
MS Word adalah aplikasi pengolah kata populer yang memungkinkan Anda membuat dokumen teks kaya. Berbagai macam dokumen sedang dibuat di MS Word termasuk faktur, dokumen teknis, laporan, dan sebagainya. DOC dan DOCX adalah format file yang digunakan MS Word untuk menyimpan dokumen.
Sebagai seorang programmer, Anda mungkin perlu memproses banyak file Word DOC/DOCX untuk mengekstrak teks biasa dari dalam aplikasi Python Anda. Jadi mari kita lihat bagaimana melakukan konversi DOC atau DOCX ke TXT dengan Python.
- Konverter Python DOCX ke TXT - Unduhan Gratis
- Langkah-langkah untuk Mengonversi DOCX ke TXT dengan Python
- Simpan DOC sebagai File TXT dengan Python
Konverter Python DOCX ke TXT - Unduhan Gratis
Aspose.Words for Python adalah perpustakaan luar biasa dengan berbagai fitur untuk memanipulasi dokumen teks populer termasuk DOC dan DOCX. Perpustakaan memudahkan cara memproses dan mengambil teks dari dokumen Word. Oleh karena itu, kami akan menggunakan pustaka ini untuk mengonversi file DOC/DOCX ke format TXT.
Anda dapat menggunakan perintah pip berikut untuk menginstal Aspose.Words for Python di aplikasi Anda.
pip install aspose-words
Cara Mengonversi DOCX ke TXT dengan Python
Aspose.Words for Python menyederhanakan konversi DOCX ke TXT yang dapat Anda lakukan dalam beberapa langkah, seperti yang disebutkan di bawah ini:
- Muat file DOCX dari disk.
- Simpan DOCX sebagai format TXT ke lokasi yang diinginkan.
Anda tidak perlu mengurai seluruh halaman dokumen Word demi halaman atau baris demi baris untuk mengekstrak teks darinya. Sekarang mari kita lihat bagaimana melakukan langkah-langkah ini dengan Python untuk mengonversi file DOCX ke format TXT.
Simpan DOC sebagai TXT dengan Python
Berikut ini adalah langkah-langkah untuk menyimpan file DOC atau DOCX sebagai TXT dengan Python.
- Muat file DOC menggunakan kelas Document.
- Simpan DOC sebagai TXT menggunakan metode Document.save(filePath) dan berikan path file sebagai parameter.
Contoh kode berikut menunjukkan cara mengonversi DOC ke TXT dengan Python.
import aspose.words as aw
# Muat file DOC
doc = aw.Document("document.doc")
# Simpan DOC sebagai TXT
doc.save("doc-to-text.txt")
Python DOC to TXT Converter - Dapatkan Lisensi Gratis
Anda dapat menggunakan lisensi sementara gratis untuk mengonversi file DOC ke format TXT tanpa batasan evaluasi.
Kesimpulan
Pada artikel ini, Anda telah mempelajari cara mengonversi file DOC atau DOCX ke format TXT dengan Python. Dengan bantuan contoh kode, Anda telah melihat cara memuat dan menyimpan file DOCX sebagai TXT ke lokasi yang diinginkan dengan Python. Selain itu, Anda dapat mengunjungi dokumentasi Aspose.Words for Python untuk mempelajari lebih lanjut tentang library ini. Jika Anda memiliki pertanyaan, jangan ragu untuk memberi tahu kami melalui forum kami.