Text aus PowerPoint C# extrahieren

Möglicherweise müssen Sie häufig Text aus den PowerPoint-Folien extrahieren, um eine Textanalyse durchzuführen. Andererseits möchten Sie den Text vielleicht extrahieren und in einer Datei oder Datenbank zur weiteren Verarbeitung speichern. Dementsprechend behandelt dieser Artikel das Extrahieren von Text aus PowerPoint Präsentationen mit C#. Insbesondere lernen Sie, wie Sie Text aus einer bestimmten Folie oder einer ganzen Präsentation extrahieren.

C# API zum Extrahieren von Text aus PowerPoint PPTX

Um PowerPoint Präsentationen zu manipulieren, bietet Aspose Aspose.Slides for .NET an. Die genannte API wurde entwickelt, um PowerPoint-Automatisierungsfunktionen in .NET Anwendungen zu implementieren. Es bietet auch einige einfache Möglichkeiten zum Extrahieren von Text aus PPTX-Präsentationen. Sie können die API entweder herunterladen oder sie mit NuGet installieren lassen.

PM> Install-Package Aspose.Slides.NET

Extrahieren Sie Text aus einer PowerPoint-Folie in C#

Im Folgenden finden Sie die Schritte zum Extrahieren von Text aus einer Folie in einer PowerPoint Präsentation.

Das folgende Codebeispiel zeigt, wie Sie mit C# Text aus einer PowerPoint-Folie extrahieren.

//Instanziieren Sie die PresentationEx Klasse, die eine PPTX Datei darstellt
Presentation pptxPresentation = new Presentation("demo.pptx");

//Rufen Sie ein Array von TextFrameEx objekten von der ersten Folie ab
ITextFrame[] textFramesSlideOne = SlideUtil.GetAllTextBoxes(pptxPresentation.Slides[0]);

//Durchlaufen Sie das Array von TextFrames
for (int i = 0; i < textFramesSlideOne.Length; i++)
{
    //Absätze im aktuellen TextFrame durchlaufen
    foreach (Paragraph para in textFramesSlideOne[i].Paragraphs)
    {
        //Teile im aktuellen Absatz durchlaufen
        foreach (Portion port in para.Portions)
        {
            //Text im aktuellen Abschnitt anzeigen
            Console.WriteLine(port.Text);

            //Schrifthöhe des Textes anzeigen
            Console.WriteLine(port.PortionFormat.FontHeight);

            //Schriftartnamen des Textes anzeigen
            Console.WriteLine(port.PortionFormat.LatinFont.FontName);
        }
    }
}

Text aus PowerPoint Präsentation in C# extrahieren

Mit Aspose.Slides for .NET können Sie auch Text aus der gesamten PowerPoint Präsentation extrahieren. Im Folgenden sind die Schritte zum Ausführen dieses Vorgangs aufgeführt.

  • Laden Sie die Präsentation mit der Klasse Presentation.
  • Rufen Sie alle Textrahmen in der Präsentation mit der methode SlideUtil.GetAllTextFrames() ab.
  • Durchlaufen Sie jeden ITextFrame und greifen Sie auf seine Absätze zu.
  • Greifen Sie auf die Teile der Absätze zu und drucken Sie ihren Text aus.

Das folgende Codebeispiel zeigt, wie Sie Text aus einer PowerPoint Präsentation extrahieren.

//Instanziieren Sie eine Presentation klasse , die eine PPTX Datei darstellt
Presentation pptxPresentation = new Presentation("demo.pptx");

//Rufen Sie ein Array von ITextFrame objekten von allen Folien im PPTX ab
ITextFrame[] textFramesPPTX = Aspose.Slides.Util.SlideUtil.GetAllTextFrames(pptxPresentation, true);

//Durchlaufen Sie das Array von TextFrames
for (int i = 0; i < textFramesPPTX.Length; i++)
{
	//Absätze im aktuellen ITextFrame durchlaufen
	foreach (IParagraph para in textFramesPPTX[i].Paragraphs)
	{
		//Teile im aktuellen IParagraph durchlaufen
		foreach (IPortion port in para.Portions)
		{
			//Text im aktuellen Abschnitt anzeigen
			Console.WriteLine(port.Text);

			//Schrifthöhe des Textes anzeigen
			Console.WriteLine(port.PortionFormat.FontHeight);

			//Schriftartnamen des Textes anzeigen
			if (port.PortionFormat.LatinFont != null)
				Console.WriteLine(port.PortionFormat.LatinFont.FontName);
		}
	}
}

Holen Sie sich eine kostenlose API Lizenz

Falls Sie die API ohne Evaluierungseinschränkungen ausprobieren möchten, können Sie eine kostenlose temporäre Lizenz erhalten.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie Text aus PowerPoint Präsentationen extrahieren. Insbesondere haben Sie gesehen, wie Sie mit C# Text aus einer bestimmten Folie oder der gesamten Präsentation extrahieren. Weitere Informationen zu Aspose.Slides for .NET finden Sie unter Dokumentation. Falls Sie Fragen oder Unklarheiten haben, informieren Sie uns über unser Forum.

Siehe auch