คุณกำลังมองหาวิธีที่ง่ายในการแยกข้อความจากไฟล์ PDF หรือไม่? ถ้าใช่ คุณมาถูกที่แล้ว ในบทความนี้ คุณจะได้เรียนรู้วิธีแปลงไฟล์ PDF เป็นข้อความธรรมดาใน Python

แปลง PDF เป็นข้อความใน Python

PDF เป็นรูปแบบเอกสารที่เป็นที่รู้จักและใช้กันทั่วโลกเนื่องจากการรองรับข้ามแพลตฟอร์ม หลายคนชอบแบ่งปันและพิมพ์เอกสารในรูปแบบ PDF เนื่องจาก PDF เป็นธุรกิจหลัก คุณอาจต้องแยกข้อความธรรมดาจากไฟล์ PDF หลายไฟล์โดยทางโปรแกรมสำหรับการวิเคราะห์ข้อความหรือการประมวลผลเพิ่มเติม มาดูวิธีการแปลง PDF เป็นข้อความจากภายในแอปพลิเคชัน Python

Python PDF เป็น Text Converter Library - ดาวน์โหลดฟรี

Aspose.Words for Python เป็นไลบรารีอันทรงพลังที่ออกแบบมาเพื่อจัดการรูปแบบเอกสารข้อความยอดนิยม ซึ่งส่วนใหญ่รวมถึงไฟล์ MS Word และ PDF เมื่อใช้ไลบรารี คุณสามารถประมวลผลข้อความในเอกสารได้อย่างง่ายดาย เราจะใช้ไลบรารีนี้เพื่อแปลงไฟล์ PDF เป็นข้อความล้วน (TXT)

คุณสามารถใช้คำสั่ง pip ต่อไปนี้เพื่อติดตั้ง Aspose.Words for Python ในแอปพลิเคชันของคุณ

pip install aspose-words

วิธีแปลง PDF เป็นข้อความใน Python

ในการแปลงไฟล์ PDF เป็นข้อความธรรมดาโดยใช้ Aspose.Words for Python เราจะทำตามขั้นตอนต่อไปนี้:

  • โหลดเอกสาร PDF จากดิสก์
  • บันทึก PDF เป็นรูปแบบ TXT ไปยังตำแหน่งที่ต้องการ

และนั่นแหล่ะ

ตอนนี้ มาดูวิธีการทำตามขั้นตอนเหล่านี้ใน Python เพื่อแปลงไฟล์ PDF เป็นรูปแบบ TXT

บันทึก PDF เป็นไฟล์ TXT ใน Python

ต่อไปนี้เป็นขั้นตอนในการบันทึกไฟล์ PDF เป็น TXT ใน Python

  • โหลดไฟล์ PDF โดยใช้คลาส Document
  • บันทึก PDF เป็น TXT โดยใช้วิธี Document.save() และส่งเส้นทางของไฟล์เป็นพารามิเตอร์

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแปลงไฟล์ PDF เป็นข้อความ (TXT) ใน Python

import aspose.words as aw

# โหลดไฟล์ PDF
doc = aw.Document("document.pdf")

# บันทึก PDF เป็น TXT
doc.save("pdf-to-text.txt")

Python PDF เป็น TXT Converter - รับใบอนุญาตฟรี

คุณสามารถใช้ ใบอนุญาตชั่วคราวฟรี เพื่อบันทึก PDF เป็นไฟล์ TXT โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแปลงไฟล์ PDF เป็นข้อความใน Python ด้วยความช่วยเหลือของตัวอย่างโค้ด คุณได้เห็นวิธีโหลดและบันทึก PDF เป็นไฟล์ TXT ไปยังตำแหน่งที่ต้องการใน Python นอกจากนี้ คุณสามารถเยี่ยมชมเอกสารประกอบของ Aspose.Words for Python เพื่อสำรวจเพิ่มเติมเกี่ยวกับไลบรารี ในกรณีที่คุณมีคำถามใดๆ โปรดแจ้งให้เราทราบผ่านทาง ฟอรัม ของเรา

ดูสิ่งนี้ด้วย