חלץ טקסט מ-PDF ב-Python

כמתכנת, ייתכן שתצטרך לעבד חבורה של קבצי PDF ולחלץ מהם טקסט. חילוץ טקסט מ-PDF עשוי להידרש למטרות שונות כגון ניתוח טקסט. במאמר זה, אנו הולכים להדגים כמה קל לחלץ טקסט מקובץ PDF ב- Python. יתר על כן, תכירו כיצד לחלץ טקסט ולשמור בקובץ TXT.

ספריית Python לחילוץ טקסט מ-PDF - הורדה חינם

Aspose.Words for Python היא ספרייה מדהימה המאפשרת לך ליצור ולעבד מסמכי טקסט בצורה חלקה. אתה יכול לתפעל את המסמכים של פורמטים פופולריים כגון DOC, DOCX ו-PDF. אנו הולכים להשתמש בספרייה זו כדי לבצע חילוץ טקסט בקבצי ה-PDF שלנו. אתה יכול להתקין את הספרייה מ-PyPI באמצעות פקודת ה-pip הבאה.

> pip install aspose-words

כיצד לחלץ טקסט מ-PDF ב-Python

Aspose.Words for Python הפכה את חילוץ טקסט PDF לקלה ביותר על ידי הסתרת הפעולות המורכבות מהמשתמש. אתה רק צריך לטעון את קובץ ה-PDF ולשמור את הטקסט שחולץ. השלבים הבאים מדגימים כיצד לחלץ טקסט מקובץ PDF באמצעות Aspose.Words עבור Python.

  • טען את קובץ ה-PDF מהמיקום הרצוי.
  • חלץ ושמור את הטקסט בקובץ txt.

וזהו. לאחר מכן תוכל לעבד את קובץ ה-.txt ולתפעל את הטקסט הפשוט שחולץ מה-PDF.

כעת נסקור כיצד לחלץ טקסט מ-PDF באופן תוכנתי ב-Python.

חילוץ טקסט מ-PDF ב-Python

להלן השלבים יחד עם מחלקות ושיטות לחילוץ טקסט PDF ב- Python.

  • טען את קובץ ה-PDF באמצעות Document class.
  • חלץ טקסט מ-PDF לקובץ txt בשיטת Document.save(fileName).

דוגמת הקוד הבאה מציגה את חילוץ הטקסט מקובץ PDF ב-Python.

# ייבוא Aspose.Words עבור מודול Python
import aspose.words as aw

# טען קובץ PDF
pdf = aw.Document("file.pdf")

# חלץ ושמור טקסט בקובץ TXT
pdf.save("extracted-text.txt")

צילום המסך הבא מציג את קובץ ה-PDF הקלט בו השתמשנו לחילוץ טקסט.

PDF לחילוץ טקסט ב-Python

צילום המסך הבא מציג את הטקסט שחולץ בקובץ TXT.

חולץ טקסט מ-PDF ל-TXT

PDF Text Extractor עבור Python - קבל רישיון חינם

אתה יכול לקבל [רישיון זמני] בחינם5 לחילוץ טקסט מ-PDF ללא מגבלות הערכה.

סיכום

במאמר זה, למדת כיצד לחלץ טקסט מקבצי PDF ב-Python. ראית כמה בקלות ובמהירות אתה יכול לחלץ טקסט מ-PDF ולשמור אותו בקובץ TXT באופן פרוגרמטי. כעת, אתה יכול ליישם חילוץ טקסט עבור אצווה של קבצי PDF ביישומי Python שלך.

חקור את מחלץ ה-PDF של Aspose עבור Python

אתה יכול לחקור תכונות אחרות של Aspose.Words עבור Python באמצעות תיעוד. אם יהיו לך שאלות כלשהן, אל תהסס ליידע אותנו דרך הפורום שלנו.

ראה גם