استخراج متن از پاورپوینت جاوا

برای انجام تجزیه و تحلیل متن ممکن است اغلب نیاز به استخراج متن از اسلایدهای پاورپوینت داشته باشید. از طرف دیگر، ممکن است بخواهید متن را در یک فایل یا پایگاه داده برای پردازش بیشتر استخراج و ذخیره کنید. مطابق با آن، این مقاله نحوه استخراج متن از ارائه های پاورپوینت با استفاده از جاوا را پوشش می دهد. به ویژه، شما یاد خواهید گرفت که چگونه متن را از یک اسلاید خاص یا کل ارائه استخراج کنید.

Java API برای استخراج متن از PowerPoint PPTX

به منظور دستکاری ارائه های پاورپوینت، Aspose Aspose.Slides for Java را ارائه می دهد. API مذکور برای پیاده سازی ویژگی های اتوماسیون پاورپوینت در برنامه های جاوا طراحی شده است. همچنین راه های ساده ای برای استخراج متن از ارائه های PPT/PPTX ارائه می دهد. می توانید API را دانلود یا با استفاده از تنظیمات Maven زیر نصب کنید.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-slides</artifactId>
    <version>21.7</version>
    <classifier>jdk16</classifier>
</dependency>

متن را از اسلاید پاورپوینت در جاوا استخراج کنید

در زیر مراحل استخراج متن از یک اسلاید در ارائه پاورپوینت با استفاده از جاوا آمده است.

  • ارائه را با استفاده از کلاس Presentation بارگیری کنید.
  • با استفاده از روش SlideUtil.getAllTextBoxes() تمام فریم های متن را از یک اسلاید در آرایه ITextFrame دریافت کنید.
  • از طریق هر ITextFrame حلقه بزنید و با استفاده از روش ITextFrame.getParagraphs() به متن آن دسترسی پیدا کنید.
  • متن را از هر IPortion پاراگراف بازیابی و چاپ کنید.

نمونه کد زیر نحوه استخراج متن از اسلاید پاورپوینت را نشان می دهد.

//کلاس PresentationEx را که یک فایل PPTX را نشان می دهد، راه اندازی کنید
Presentation pptxPresentation = new Presentation("presentation.pptx");

//آرایه ای از اشیاء ITextFrame را از اسلاید اول دریافت کنید
ITextFrame[] textFramesSlideOne = SlideUtil.getAllTextBoxes(pptxPresentation.getSlides().get_Item(1));

//از طریق آرایه TextFrames حلقه بزنید
for (int i = 0; i < textFramesSlideOne.length; i++)
{
    //از میان پاراگراف ها در TextFrame فعلی حلقه بزنید
   for (IParagraph para : textFramesSlideOne[i].getParagraphs())
    {
        //بخش‌های پاراگراف فعلی را حلقه بزنید
       for (IPortion port : para.getPortions())
        {
            //نمایش متن در قسمت فعلی
            System.out.println(port.getText());

            //نمایش ارتفاع فونت متن
            System.out.println(port.getPortionFormat().getFontHeight());

            //نمایش نام فونت متن
            System.out.println(port.getPortionFormat().getLatinFont().getFontName());
        }
    }
}

متن را از کل ارائه پاورپوینت استخراج کنید

همچنین می توانید متن را از کل ارائه پاورپوینت استخراج کنید. مراحل زیر برای انجام این عملیات آورده شده است.

  • ارائه را با استفاده از کلاس Presentation بارگیری کنید.
  • با استفاده از روش SlideUtil.getAllTextFrames() تمام فریم های متن را در ارائه دریافت کنید.
  • از طریق هر ITextFrame حلقه بزنید و به پاراگراف های آن دسترسی پیدا کنید.
  • به بخش هایی از پاراگراف ها دسترسی داشته باشید و متن آنها را چاپ کنید.

نمونه کد زیر نحوه استخراج متن از ارائه پاورپوینت را نشان می دهد.

//کلاس PresentationEx را که یک فایل PPTX را نشان می دهد، راه اندازی کنید
Presentation pptxPresentation = new Presentation("presentation.pptx");

//آرایه ای از اشیاء ITextFrame را از اسلاید اول دریافت کنید
ITextFrame[] textFrames = SlideUtil.getAllTextFrames(pptxPresentation, true);

//از طریق آرایه TextFrames حلقه بزنید
for (int i = 0; i < textFrames.length; i++)
{
    //از میان پاراگراف ها در TextFrame فعلی حلقه بزنید
   for (IParagraph para : textFrames[i].getParagraphs())
    {
        //بخش‌های پاراگراف فعلی را حلقه بزنید
       for (IPortion port : para.getPortions())
        {
            //نمایش متن در قسمت فعلی
            System.out.println(port.getText());
        }
    }
}

مجوز API رایگان دریافت کنید

در صورتی که می‌خواهید از API بدون محدودیت ارزیابی استفاده کنید، می‌توانید یک مجوز موقت رایگان دریافت کنید.

آنلاین را امتحان کنید

همچنین می توانید تجزیه کننده ارائه آنلاین رایگان را امتحان کنید که با استفاده از Aspose.Slides توسعه یافته است.

نتیجه

در این مقاله نحوه استخراج متن از ارائه های پاورپوینت با استفاده از جاوا را یاد گرفتید. نمونه کد نحوه استخراج متن از یک اسلاید خاص یا کل ارائه را نشان داده است. می توانید با استفاده از documentation درباره Aspose.Slides برای جاوا بیشتر کاوش کنید. اگر سؤالی دارید، از طریق [فروم 13 ما به ما اطلاع دهید.

همچنین ببینید