Витягніть текст із PowerPoint Java

Вам може часто знадобитися витягти текст зі слайдів PowerPoint, щоб виконати аналіз тексту. З іншого боку, ви можете витягти та зберегти текст у файлі або базі даних для подальшої обробки. Відповідно до цього, у цій статті розповідається про те, як отримати текст із презентацій PowerPoint за допомогою Java. Зокрема, ви дізнаєтеся, як витягти текст із певного слайда чи всієї презентації.

Java API для вилучення тексту з PowerPoint PPTX

Для роботи з презентаціями PowerPoint Aspose пропонує Aspose.Slides for Java. Зазначений API призначений для реалізації функцій автоматизації PowerPoint у програмах Java. Він також надає кілька простих способів вилучення тексту з презентацій PPT/PPTX. Ви можете завантажити API або встановити його за допомогою наведених нижче конфігурацій Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-slides</artifactId>
    <version>21.7</version>
    <classifier>jdk16</classifier>
</dependency>

Витягніть текст із слайда PowerPoint у Java

Нижче наведено кроки для отримання тексту зі слайда презентації PowerPoint за допомогою Java.

  • Завантажте презентацію за допомогою класу Presentation.
  • Отримайте всі текстові кадри зі слайда в масив ITextFrame за допомогою методу SlideUtil.getAllTextBoxes().
  • Перегляньте кожен ITextFrame та отримайте доступ до його тексту за допомогою методу ITextFrame.getParagraphs().
  • Отримайте та надрукуйте текст з кожного IPortion абзацу.

У наведеному нижче прикладі коду показано, як витягнути текст зі слайда PowerPoint.

//Встановіть клас PresentationEx, який представляє файл PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");

//Отримайте масив об’єктів ITextFrame з першого слайда
ITextFrame[] textFramesSlideOne = SlideUtil.getAllTextBoxes(pptxPresentation.getSlides().get_Item(1));

//Переглядайте масив текстових кадрів
for (int i = 0; i < textFramesSlideOne.length; i++)
{
    //Перегляд абзаців у поточному TextFrame
   for (IParagraph para : textFramesSlideOne[i].getParagraphs())
    {
        //Переглядайте частини поточного абзацу
       for (IPortion port : para.getPortions())
        {
            //Показати текст у поточній частині
            System.out.println(port.getText());

            //Показати висоту шрифту тексту
            System.out.println(port.getPortionFormat().getFontHeight());

            //Відображення назви шрифту тексту
            System.out.println(port.getPortionFormat().getLatinFont().getFontName());
        }
    }
}

Витягніть текст із усієї презентації PowerPoint

Ви також можете витягнути текст із усієї презентації PowerPoint. Нижче наведено кроки для виконання цієї операції.

  • Завантажте презентацію за допомогою класу Presentation.
  • Отримайте всі текстові кадри в презентації за допомогою методу SlideUtil.getAllTextFrames().
  • Перегляньте кожен ITextFrame і перейдіть до його абзаців.
  • Перегляньте частини абзаців і надрукуйте їх текст.

У наведеному нижче прикладі коду показано, як отримати текст із презентації PowerPoint.

//Встановіть клас PresentationEx, який представляє файл PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");

//Отримайте масив об’єктів ITextFrame з першого слайда
ITextFrame[] textFrames = SlideUtil.getAllTextFrames(pptxPresentation, true);

//Переглядайте масив текстових кадрів
for (int i = 0; i < textFrames.length; i++)
{
    //Перегляд абзаців у поточному TextFrame
   for (IParagraph para : textFrames[i].getParagraphs())
    {
        //Переглядайте частини поточного абзацу
       for (IPortion port : para.getPortions())
        {
            //Показати текст у поточній частині
            System.out.println(port.getText());
        }
    }
}

Отримайте безкоштовну ліцензію API

Якщо ви хочете використовувати API без оціночних обмежень, ви можете отримати безкоштовну тимчасову ліцензію.

Спробуйте онлайн

Ви також можете спробувати безкоштовний аналізатор онлайн-презентацій, розроблений за допомогою Aspose.Slides.

Висновок

У цій статті ви дізналися, як видобувати текст із презентацій PowerPoint за допомогою Java. Зразки коду показали, як витягти текст із певного слайда чи всієї презентації. Ви можете дізнатися більше про Aspose.Slides for Java за допомогою документації. Якщо у вас виникнуть запитання, повідомте нас через наш форум.

Дивись також