Estrai testo da PowerPoint C#

Potrebbe essere necessario estrarre spesso del testo dalle diapositive di PowerPoint per eseguire l’analisi del testo. D’altra parte, potresti voler estrarre e salvare il testo in un file o in un database per un’ulteriore elaborazione. In base a ciò, questo articolo illustra come estrarre il testo dalle presentazioni di PowerPoint usando C#. In particolare, imparerai come estrarre il testo da una diapositiva specifica o da un’intera presentazione.

API C# per estrarre testo da PowerPoint PPTX

Per manipolare le presentazioni PowerPoint, Aspose offre Aspose.Slides for .NET. La suddetta API è progettata per implementare le funzionalità di automazione di PowerPoint nelle applicazioni .NET. Fornisce inoltre alcuni semplici modi per estrarre il testo dalle presentazioni PPTX. Puoi scaricare l’API o installarla utilizzando NuGet.

PM> Install-Package Aspose.Slides.NET

Estrai testo da una diapositiva PowerPoint in C#

Di seguito sono riportati i passaggi per estrarre il testo da una diapositiva in una presentazione di PowerPoint.

Nell’esempio di codice seguente viene illustrato come estrarre il testo da una diapositiva di PowerPoint usando C#.

//Instatiate la classe PresentationEx che rappresenta un file PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");

//Ottieni una matrice di oggetti TextFrameEx dalla prima diapositiva
ITextFrame[] textFramesSlideOne = SlideUtil.GetAllTextBoxes(pptxPresentation.Slides[0]);

//Passa attraverso l'array di TextFrames
for (int i = 0; i < textFramesSlideOne.Length; i++)
{
    //Scorri i paragrafi nell'attuale TextFrame
    foreach (Paragraph para in textFramesSlideOne[i].Paragraphs)
    {
        //Scorri le parti del paragrafo corrente
        foreach (Portion port in para.Portions)
        {
            //Visualizza il testo nella parte corrente
            Console.WriteLine(port.Text);

            //Visualizza l'altezza del carattere del testo
            Console.WriteLine(port.PortionFormat.FontHeight);

            //Visualizza il nome del carattere del testo
            Console.WriteLine(port.PortionFormat.LatinFont.FontName);
        }
    }
}

Estrai il testo dalla presentazione di PowerPoint in C#

Puoi anche estrarre il testo dall’intera presentazione di PowerPoint usando Aspose.Slides per .NET. Di seguito sono riportati i passaggi per eseguire questa operazione.

Nell’esempio di codice seguente viene illustrato come estrarre il testo da una presentazione di PowerPoint.

//Instatiate Classe di presentazione che rappresenta un file PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");

//Ottieni una matrice di oggetti ITextFrame da tutte le diapositive nel PPTX
ITextFrame[] textFramesPPTX = Aspose.Slides.Util.SlideUtil.GetAllTextFrames(pptxPresentation, true);

//Passa attraverso l'array di TextFrames
for (int i = 0; i < textFramesPPTX.Length; i++)
{
	//Scorri i paragrafi nell'attuale ITextFrame
	foreach (IParagraph para in textFramesPPTX[i].Paragraphs)
	{
		//Passa in rassegna le porzioni nell'IParagrafo corrente
		foreach (IPortion port in para.Portions)
		{
			//Visualizza il testo nella parte corrente
			Console.WriteLine(port.Text);

			//Visualizza l'altezza del carattere del testo
			Console.WriteLine(port.PortionFormat.FontHeight);

			//Visualizza il nome del carattere del testo
			if (port.PortionFormat.LatinFont != null)
				Console.WriteLine(port.PortionFormat.LatinFont.FontName);
		}
	}
}

Ottieni una licenza API gratuita

Nel caso in cui desideri provare l’API senza limitazioni di valutazione, puoi ottenere una licenza temporanea gratuita.

Conclusione

In questo articolo, hai imparato come estrarre il testo dalle presentazioni di PowerPoint. In particolare, hai visto come estrarre il testo da una diapositiva specifica o dall’intera presentazione usando C#. Puoi esplorare di più su Aspose.Slides per .NET usando documentazione. In caso di domande o confusione, informaci tramite il nostro forum.

Guarda anche