บทความนี้นำเสนอวิธีที่ง่ายที่สุดในการแยกข้อความล้วนจากไฟล์ Word DOCX หรือ DOC ในแอปพลิเคชัน Python ของคุณ หลังจากอ่านบทความนี้ คุณจะได้เรียนรู้วิธีแปลงไฟล์ DOCX หรือ DOC เป็น TXT ใน Python

แปลง DOC DOCX เป็น TXT ใน Python

MS Word เป็นแอปพลิเคชั่นประมวลผลคำยอดนิยมที่ให้คุณสร้างเอกสาร Rich Text มีการสร้างเอกสารมากมายใน MS Word รวมถึงใบแจ้งหนี้ เอกสารทางเทคนิค รายงาน และอื่นๆ DOC และ DOCX เป็นรูปแบบไฟล์ที่ MS Word ใช้ในการจัดเก็บเอกสาร

ในฐานะโปรแกรมเมอร์ คุณอาจต้องประมวลผลไฟล์ Word DOC/DOCX จำนวนมากเพื่อแยกข้อความล้วนจากภายในแอปพลิเคชัน Python ของคุณ มาดูวิธีการแปลง DOC หรือ DOCX เป็น TXT ใน Python

Python DOCX เป็น TXT Converter - ดาวน์โหลดฟรี

Aspose.Words for Python เป็นไลบรารี่ที่ยอดเยี่ยมพร้อมฟีเจอร์มากมายในการจัดการกับเอกสารข้อความยอดนิยม รวมถึง DOC และ DOCX ไลบรารีช่วยให้วิธีการประมวลผลและดึงข้อความจากเอกสาร Word ง่ายขึ้น ดังนั้น เราจะใช้ไลบรารีนี้เพื่อแปลงไฟล์ DOC/DOCX เป็นรูปแบบ TXT

คุณสามารถใช้คำสั่ง pip ต่อไปนี้เพื่อติดตั้ง Aspose.Words for Python ในแอปพลิเคชันของคุณ

pip install aspose-words

วิธีแปลง DOCX เป็น TXT ใน Python

Aspose.Words for Python ช่วยลดความยุ่งยากในการแปลง DOCX เป็น TXT ที่คุณสามารถทำได้ภายในสองสามขั้นตอน ดังที่กล่าวไว้ด้านล่าง:

  • โหลดไฟล์ DOCX จากดิสก์
  • บันทึก DOCX เป็นรูปแบบ TXT ไปยังตำแหน่งที่ต้องการ

คุณไม่จำเป็นต้องแยกวิเคราะห์เอกสาร Word ทั้งหมดทีละหน้าหรือทีละบรรทัดเพื่อแยกข้อความออกมา มาดูวิธีทำตามขั้นตอนเหล่านี้ใน Python เพื่อแปลงไฟล์ DOCX เป็นรูปแบบ TXT

บันทึก DOC เป็น TXT ใน Python

ต่อไปนี้เป็นขั้นตอนในการบันทึกไฟล์ DOC หรือ DOCX เป็น TXT ใน Python

  • โหลดไฟล์ DOC โดยใช้คลาส Document
  • บันทึก DOC เป็น TXT โดยใช้วิธี Document.save(filePath) และส่งพาธของไฟล์เป็นพารามิเตอร์

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลง DOC เป็น TXT ใน Python

import aspose.words as aw

# โหลดไฟล์ DOC
doc = aw.Document("document.doc")

# บันทึก DOC เป็น TXT
doc.save("doc-to-text.txt")

Python DOC เป็น TXT Converter - รับใบอนุญาตฟรี

คุณสามารถใช้ ใบอนุญาตชั่วคราวฟรี เพื่อแปลงไฟล์ DOC เป็นรูปแบบ TXT โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแปลงไฟล์ DOC หรือ DOCX เป็นรูปแบบ TXT ใน Python ด้วยความช่วยเหลือของตัวอย่างโค้ด คุณได้เห็นวิธีโหลดและบันทึกไฟล์ DOCX เป็น TXT ไปยังตำแหน่งที่ต้องการใน Python นอกจากนี้ คุณสามารถเยี่ยมชมเอกสารประกอบของ Aspose.Words for Python เพื่อสำรวจเพิ่มเติมเกี่ยวกับไลบรารี ในกรณีที่คุณมีคำถามใดๆ โปรดแจ้งให้เราทราบผ่านทาง ฟอรัม ของเรา

ดูสิ่งนี้ด้วย