แปลง PDF เป็น TXT ใน Python

PDF เป็นรูปแบบไฟล์ที่รู้จักกันดีซึ่งมีเลย์เอาต์ที่สอดคล้องกันของเอกสารในแพลตฟอร์มที่แตกต่างกัน มีคุณสมบัติและองค์ประกอบมากมายสำหรับสร้างเอกสาร Rich Text อย่างไรก็ตาม ในบางกรณี เช่น เพื่อแยกวิเคราะห์ข้อความในเอกสาร คุณต้องแปลงไฟล์ PDF เป็นรูปแบบ TXT โดยทางโปรแกรม บทความนี้ครอบคลุมวิธีแปลงไฟล์ PDF เป็นรูปแบบ TXT ใน Python

Python PDF เป็น TXT Converter Library

ในการบันทึกไฟล์ PDF ในรูปแบบ TXT เราจะใช้ Aspose.Words for Python เป็นไลบรารี Python อันทรงพลังที่ช่วยให้คุณสร้างและจัดการเอกสารข้อความได้อย่างราบรื่น คุณสามารถติดตั้งไลบรารีในแอปพลิเคชัน Python ได้จาก PyPI โดยใช้คำสั่ง pip ต่อไปนี้

> pip install aspose-words

วิธีแปลง PDF เป็น TXT ใน Python

มาดูวิธีแปลงไฟล์ PDF เป็น TXT ใน Python สำหรับสิ่งนี้ คุณจะต้องโหลดไฟล์ PDF และบันทึกเป็นไฟล์ TXT เท่านั้น ต่อไปนี้เป็นขั้นตอนในการบันทึกไฟล์ PDF ในรูปแบบ TXT ใน Python

  • โหลดไฟล์ PDF โดยใช้คลาส Document
  • บันทึก PDF เป็น TXT โดยใช้วิธี Document.save()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลง PDF เป็น TXT ใน Python

import aspose.words as aw

# โหลดไฟล์ PDF
doc = aw.Document("Input.pdf")

# แปลง PDF เป็น TXT
doc.save("Output.txt")

รับใบอนุญาตฟรี

คุณสามารถ รับใบอนุญาตชั่วคราวได้ฟรี เพื่อใช้ Aspose.Words for Python โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแปลงไฟล์ PDF เป็นรูปแบบ TXT ใน Python คุณจึงประมวลผลข้อความในไฟล์ PDF ได้สะดวกยิ่งขึ้น คุณสามารถติดตั้ง Aspose.Words for Python และทำการแปลง PDF เป็น TXT จากภายในแอปพลิเคชัน Python ของคุณ นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับห้องสมุดโดยใช้ เอกสารประกอบ นอกจากนี้ คุณสามารถแบ่งปันคำถามหรือข้อสงสัยของคุณผ่าน ฟอรัม ของเรา

ดูสิ่งนี้ด้วย