בתרחישים שונים, הטקסט נשלף מהמסמכים להמשך עיבוד כמו בניתוח טקסט, סיווג וכדומה. בין שאר המסמכים כמו PDF ו-Word, נעשה שימוש בקבצי PowerPoint גם בחילוץ טקסט. לכן, מאמר זה נועד להראות לך כיצד לחלץ טקסט מ-PowerPoint PPT ב-Python. נסקור כיצד לחלץ טקסט משקופית מסוימת או מהמצגת כולה.
ספריית Python לחילוץ טקסט מ-PowerPoint PPT
כדי לחלץ טקסט מ-PowerPoint PPT, נשתמש ב-Aspose.Slides עבור Python דרך .NET. זוהי ספריית Python עשירה בתכונות ליצירה ולעדכון מצגות PowerPoint. יתר על כן, זה מאפשר לך לתפעל ולהמיר את המצגות בצורה חלקה. אתה יכול להתקין ספרייה זו מ-PyPI באמצעות פקודת ה-pip הבאה.
> pip install aspose.slides
חלץ טקסט מ-PowerPoint PPT ב-Python
בהתאם לתרחיש, ייתכן שתצטרך לחלץ טקסט ממצגת PowerPoint כולה או משקופיות ספציפיות. בסעיפים הבאים, נדגים כיצד לבצע חילוץ טקסט בשני המקרים שהוזכרו לעיל. אז בואו נמשיך.
Python: חלץ טקסט משקופית PPT ספציפית
להלן השלבים לחילוץ טקסט משקופית ספציפית ב-PPT ב-Python.
ראשית, השתמש בשיטה PresentationFactory().getpresentationtext(string, TextExtractionArrangingMode) כדי לקבל את כל סוגי הטקסט במצגת.
לאחר מכן, השתמש באינדקס כדי לחלץ טקסט של שקופית ספציפית ממערך טקסט שקופיות.
להלן סוגי הטקסט שאתה יכול לחלץ:
הטקסט של השקופית
הערות
טקסט פריסת שקף
טקסט מאסטר של שקף
דגימת הקוד הבאה מראה כיצד לחלץ טקסט משקופית PPT ספציפית ב-Python.
import aspose.slides as slides
# קבל את כל הטקסט מהמצגת
text = slides.PresentationFactory().get_presentation_text("presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED)
# הדפס טקסט של השקופית הרצויה באמצעות האינדקס שלה
print(text.slides_text[0].text)
print(text.slides_text[0].layout_text)
print(text.slides_text[0].master_text)
print(text.slides_text[0].notes_text)
חילוץ טקסט Python מכל PowerPoint PPT
השלבים הבאים מדגימים כיצד לחלץ טקסט מכל השקופיות של מצגת PowerPoint.
- ראשית, השתמש בשיטה PresentationFactory().getpresentationtext(string, TextExtractionArrangingMode) כדי לקבל את כל סוגי הטקסט במצגת.
- טען מצגת באובייקט מצגת.
- חזור על מספר השקופיות במצגת.
- חלץ טקסט מכל שקופית באמצעות מערך טקסט slides.
דגימת הקוד הבאה מראה כיצד לחלץ טקסט מקובץ PPTX (או PPT) ב-Python.
import aspose.slides as slides
# קבל את כל הטקסט מהמצגת
text = slides.PresentationFactory().get_presentation_text("presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED)
# טען את המצגת כדי לקבל ספירת שקופיות
with slides.Presentation("presentation.pptx") as ppt:
# עברו בלולאה בין שקופיות במצגת
for index in range(ppt.slides.length):
# הדפס טקסט של חלקים רצויים כגון טקסט של שקף, טקסט פריסה, הערות וכו'.
print(text.slides_text[index].text)
print(text.slides_text[index].layout_text)
print(text.slides_text[index].master_text)
print(text.slides_text[index].notes_text)
ספריית חילוץ טקסט של Python PPT - קבל רישיון חינם
אתה יכול להשתמש ב-Aspose.Slides עבור Python ללא מגבלות הערכה על ידי קבלת רישיון זמני.
סיכום
במאמר זה, למדת כיצד לחלץ טקסט מ-PowerPoint PPT ב-Python. ראית כיצד לחלץ טקסט משקופית מסוימת או מכל השקופיות במצגת PowerPoint. חוץ מזה, אתה יכול לחקור תכונות אחרות של Aspose.Slides עבור Python באמצעות תיעוד. כמו כן, אתה יכול לשתף אותנו בשאילתות שלך דרך הפורום שלנו.