האם אתה מחפש דרך קלה לחילוץ טקסט מקבצי PDF? אם כן, נחתתם למקום הנכון כמו במאמר זה, תלמדו כיצד להמיר קובץ PDF לטקסט רגיל בפייתון.

המרת PDF לטקסט ב-Python

PDF הוא פורמט מסמכים ידוע ונעשה בו שימוש גלובלי בגלל התמיכה שלו בפלטפורמות שונות. אנשים רבים מעדיפים לשתף ולהדפיס את המסמכים בפורמט PDF. מכיוון ש-PDF הוא מאוד בעסק, ייתכן שיהיה עליך לחלץ טקסט רגיל מקבצי PDF מרובים באופן תוכנתי לצורך ניתוח טקסט או עיבוד נוסף. אז בואו נראה כיצד לבצע המרת PDF לטקסט מתוך אפליקציית Python.

ספריית ממיר PDF לטקסט Python - הורדה חינם

Aspose.Words for Python היא ספרייה רבת עוצמה שנועדה לתמרן פורמטים פופולריים של מסמכי טקסט, הכוללים בעיקר קבצי MS Word ו-PDF. באמצעות הספרייה תוכלו לעבד בקלות את הטקסט במסמכים. אנו נשתמש בספרייה זו כדי להמיר את קבצי ה-PDF לטקסט רגיל (TXT).

אתה יכול להשתמש בפקודה pip הבאה כדי להתקין את Aspose.Words עבור Python ביישום שלך.

pip install aspose-words

כיצד להמיר PDF לטקסט ב- Python

כדי להמיר קובץ PDF לטקסט רגיל באמצעות Aspose.Words עבור Python, נבצע את השלבים הבאים:

  • טען את מסמך ה-PDF מהדיסק.
  • שמור PDF כפורמט TXT למיקום הרצוי.

וזה הכל.

כעת, בואו נראה כיצד לבצע את השלבים הללו ב- Python כדי להמיר קובץ PDF לפורמט TXT.

שמור PDF כקובץ TXT ב- Python

להלן השלבים לשמירת קובץ PDF כ-TXT ב-Python.

  • טען את קובץ ה-PDF באמצעות Document class.
  • שמור PDF כ-TXT באמצעות שיטת Document.save() והעבר את נתיב הקובץ כפרמטר.

דוגמת הקוד הבאה מראה כיצד להמיר קובץ PDF לטקסט (TXT) ב-Python.

import aspose.words as aw

# טען קובץ PDF
doc = aw.Document("document.pdf")

# שמור PDF כ-TXT
doc.save("pdf-to-text.txt")

Python PDF to TXT Converter - קבל רישיון חינם

אתה יכול להשתמש ברישיון זמני ללא תשלום כדי לשמור קובצי PDF כקובצי TXT ללא מגבלות הערכה.

סיכום

במאמר זה, למדת כיצד להמיר קבצי PDF לטקסט ב-Python. בעזרת דגימת קוד, ראית כיצד לטעון ולשמור PDF כקובץ TXT למיקום הרצוי ב- Python. חוץ מזה, אתה יכול לבקר בתיעוד של Aspose.Words for Python כדי לחקור יותר על הספרייה. אם יהיו לך שאלות כלשהן, אל תהסס ליידע אותנו דרך הפורום שלנו.

ראה גם