Extrahujte text z PowerPoint C#

Často budete muset extrahovat text ze snímků aplikace PowerPoint, abyste mohli provést analýzu textu. Na druhou stranu můžete chtít extrahovat a uložit text do souboru nebo databáze pro další zpracování. V souladu s tím tento článek popisuje, jak extrahovat text z prezentací PowerPoint pomocí C#. Zejména se naučíte, jak extrahovat text z konkrétního snímku nebo celé prezentace.

C# API pro extrahování textu z PowerPoint PPTX

Aby bylo možné manipulovat s prezentacemi v PowerPointu, Aspose nabízí Aspose.Slides for .NET. Uvedené API je navrženo pro implementaci funkcí automatizace PowerPointu v aplikacích .NET. Poskytuje také několik jednoduchých způsobů extrahování textu z prezentací PPTX. API si můžete buď stáhnout, nebo jej nainstalovat pomocí NuGet.

PM> Install-Package Aspose.Slides.NET

Extrahujte text z PowerPoint snímku v C#

Následují kroky k extrahování textu ze snímku v prezentaci PowerPoint.

Následující ukázka kódu ukazuje, jak extrahovat text ze snímku aplikace PowerPoint pomocí jazyka C#.

//Instatiate PresentationEx třídu, která představuje soubor PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");

//Získejte pole objektů TextFrameEx z prvního snímku
ITextFrame[] textFramesSlideOne = SlideUtil.GetAllTextBoxes(pptxPresentation.Slides[0]);

//Procházejte polem TextFrames
for (int i = 0; i < textFramesSlideOne.Length; i++)
{
    //Procházet odstavce v aktuálním TextFrame
    foreach (Paragraph para in textFramesSlideOne[i].Paragraphs)
    {
        //Procházejte části v aktuálním odstavci
        foreach (Portion port in para.Portions)
        {
            //Zobrazit text v aktuální části
            Console.WriteLine(port.Text);

            //Zobrazení výšky písma textu
            Console.WriteLine(port.PortionFormat.FontHeight);

            //Zobrazit název písma textu
            Console.WriteLine(port.PortionFormat.LatinFont.FontName);
        }
    }
}

Extrahujte text z PowerPointové prezentace v C#

Můžete také extrahovat text z celé prezentace PowerPoint pomocí Aspose.Slides for .NET. Následují kroky k provedení této operace.

Následující ukázka kódu ukazuje, jak extrahovat text z prezentace PowerPoint.

//Třída Instatiate Presentation, která představuje soubor PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");

//Získejte pole objektů ITextFrame ze všech snímků v PPTX
ITextFrame[] textFramesPPTX = Aspose.Slides.Util.SlideUtil.GetAllTextFrames(pptxPresentation, true);

//Procházejte polem TextFrames
for (int i = 0; i < textFramesPPTX.Length; i++)
{
	//Procházejte odstavce v aktuálním ITextFrame
	foreach (IParagraph para in textFramesPPTX[i].Paragraphs)
	{
		//Procházejte části v aktuálním IP odstavci
		foreach (IPortion port in para.Portions)
		{
			//Zobrazit text v aktuální části
			Console.WriteLine(port.Text);

			//Zobrazení výšky písma textu
			Console.WriteLine(port.PortionFormat.FontHeight);

			//Zobrazit název písma textu
			if (port.PortionFormat.LatinFont != null)
				Console.WriteLine(port.PortionFormat.LatinFont.FontName);
		}
	}
}

Získejte bezplatnou licenci API

V případě, že chcete API vyzkoušet bez omezení hodnocení, můžete získat bezplatnou dočasnou licenci.

Závěr

V tomto článku jste se naučili extrahovat text z prezentací PowerPoint. Konkrétně jste viděli, jak extrahovat text z konkrétního snímku nebo celé prezentace pomocí C#. Více o Aspose.Slides for .NET můžete prozkoumat pomocí dokumentace. V případě, že byste měli nějaké dotazy nebo nejasnosti, informujte nás prostřednictvím našeho fóra.

Viz také