Estrai testo da PowerPoint Java

Potrebbe essere necessario estrarre spesso del testo dalle diapositive di PowerPoint per eseguire l’analisi del testo. D’altra parte, potresti voler estrarre e salvare il testo in un file o in un database per un’ulteriore elaborazione. In accordo con ciò, questo articolo spiega come estrarre testo da presentazioni PowerPoint utilizzando Java. In particolare, imparerai come estrarre il testo da una diapositiva specifica o da un’intera presentazione.

API Java per estrarre testo da PowerPoint PPTX

Per manipolare le presentazioni PowerPoint, Aspose offre Aspose.Slides for Java. La suddetta API è progettata per implementare le funzionalità di automazione di PowerPoint nelle applicazioni Java. Fornisce inoltre alcuni semplici modi per estrarre il testo dalle presentazioni PPT/PPTX. Puoi scaricare l’API o installarla utilizzando le seguenti configurazioni Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-slides</artifactId>
    <version>21.7</version>
    <classifier>jdk16</classifier>
</dependency>

Estrai testo da una diapositiva PowerPoint in Java

Di seguito sono riportati i passaggi per estrarre il testo da una diapositiva in una presentazione PowerPoint utilizzando Java.

Nell’esempio di codice seguente viene illustrato come estrarre il testo da una diapositiva di PowerPoint.

//Instatiate la classe PresentationEx che rappresenta un file PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");

//Ottieni una matrice di oggetti ITextFrame dalla prima diapositiva
ITextFrame[] textFramesSlideOne = SlideUtil.getAllTextBoxes(pptxPresentation.getSlides().get_Item(1));

//Passa attraverso l'array di TextFrames
for (int i = 0; i < textFramesSlideOne.length; i++)
{
    //Scorri i paragrafi nell'attuale TextFrame
    for (IParagraph para : textFramesSlideOne[i].getParagraphs())
    {
        //Scorri le parti del paragrafo corrente
        for (IPortion port : para.getPortions())
        {
            //Visualizza il testo nella parte corrente
            System.out.println(port.getText());

            //Visualizza l'altezza del carattere del testo
            System.out.println(port.getPortionFormat().getFontHeight());

            //Visualizza il nome del carattere del testo
            System.out.println(port.getPortionFormat().getLatinFont().getFontName());
        }
    }
}

Estrai il testo dall’intera presentazione di PowerPoint

Puoi anche estrarre il testo dall’intera presentazione di PowerPoint. Di seguito sono riportati i passaggi per eseguire questa operazione.

  • Carica la presentazione usando la classe Presentazione.
  • Ottieni tutte le cornici di testo nella presentazione usando il metodo SlideUtil.getAllTextFrames().
  • Scorri ogni ITextFrame e accedi ai suoi paragrafi.
  • Accedi alle porzioni dei paragrafi e stampa il loro testo.

Nell’esempio di codice seguente viene illustrato come estrarre il testo da una presentazione di PowerPoint.

//Instatiate la classe PresentationEx che rappresenta un file PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");

//Ottieni una matrice di oggetti ITextFrame dalla prima diapositiva
ITextFrame[] textFrames = SlideUtil.getAllTextFrames(pptxPresentation, true);

//Passa attraverso l'array di TextFrames
for (int i = 0; i < textFrames.length; i++)
{
    //Scorri i paragrafi nell'attuale TextFrame
    for (IParagraph para : textFrames[i].getParagraphs())
    {
        //Scorri le parti del paragrafo corrente
        for (IPortion port : para.getPortions())
        {
            //Visualizza il testo nella parte corrente
            System.out.println(port.getText());
        }
    }
}

Ottieni una licenza API gratuita

Nel caso in cui desideri utilizzare l’API senza limitazioni di valutazione, puoi ottenere una licenza temporanea gratuita.

Prova in linea

Puoi anche provare il parser di presentazione online gratuito, sviluppato utilizzando Aspose.Slides.

Conclusione

In questo articolo, hai imparato come estrarre il testo dalle presentazioni di PowerPoint utilizzando Java. Gli esempi di codice hanno mostrato come estrarre il testo da una diapositiva specifica o dall’intera presentazione. Puoi esplorare di più su Aspose.Slides per Java usando documentazione. In caso di domande, informaci tramite il nostro forum.

Guarda anche