Často budete muset extrahovat text ze snímků aplikace PowerPoint, abyste mohli provést analýzu textu. Na druhou stranu můžete chtít extrahovat a uložit text do souboru nebo databáze pro další zpracování. V souladu s tím tento článek popisuje, jak extrahovat text z prezentací PowerPoint pomocí C#. Zejména se naučíte, jak extrahovat text z konkrétního snímku nebo celé prezentace.
- API pro extrahování textu z PowerPoint PPTX
- Extrahujte text ze snímku aplikace PowerPoint
- Extrahujte text z prezentace v PowerPointu
- Získejte bezplatnou licenci API
C# API pro extrahování textu z PowerPoint PPTX
Aby bylo možné manipulovat s prezentacemi v PowerPointu, Aspose nabízí Aspose.Slides for .NET. Uvedené API je navrženo pro implementaci funkcí automatizace PowerPointu v aplikacích .NET. Poskytuje také několik jednoduchých způsobů extrahování textu z prezentací PPTX. API si můžete buď stáhnout, nebo jej nainstalovat pomocí NuGet.
PM> Install-Package Aspose.Slides.NET
Extrahujte text z PowerPoint snímku v C#
Následují kroky k extrahování textu ze snímku v prezentaci PowerPoint.
- Načtěte prezentaci pomocí třídy Presentation.
- Získejte všechny textové rámečky ze snímku do pole ITextFrame pomocí metody SlideUtil.GetAllTextBoxes().
- Procházejte každý ITextFrame a získejte přístup k jeho textu pomocí vlastnosti ITextFrame.Paragraphs.
- Načtěte a vytiskněte text z každé části odstavce.
Následující ukázka kódu ukazuje, jak extrahovat text ze snímku aplikace PowerPoint pomocí jazyka C#.
//Instatiate PresentationEx třídu, která představuje soubor PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");
//Získejte pole objektů TextFrameEx z prvního snímku
ITextFrame[] textFramesSlideOne = SlideUtil.GetAllTextBoxes(pptxPresentation.Slides[0]);
//Procházejte polem TextFrames
for (int i = 0; i < textFramesSlideOne.Length; i++)
{
//Procházet odstavce v aktuálním TextFrame
foreach (Paragraph para in textFramesSlideOne[i].Paragraphs)
{
//Procházejte části v aktuálním odstavci
foreach (Portion port in para.Portions)
{
//Zobrazit text v aktuální části
Console.WriteLine(port.Text);
//Zobrazení výšky písma textu
Console.WriteLine(port.PortionFormat.FontHeight);
//Zobrazit název písma textu
Console.WriteLine(port.PortionFormat.LatinFont.FontName);
}
}
}
Extrahujte text z PowerPointové prezentace v C#
Můžete také extrahovat text z celé prezentace PowerPoint pomocí Aspose.Slides for .NET. Následují kroky k provedení této operace.
- Načtěte prezentaci pomocí třídy Presentation.
- Získejte všechny textové rámečky v prezentaci pomocí metody SlideUtil.GetAllTextFrames().
- Projděte každý ITextFrame a otevřete jeho Odstavce.
- Přístup k částem odstavců a tisk jejich textu.
Následující ukázka kódu ukazuje, jak extrahovat text z prezentace PowerPoint.
//Třída Instatiate Presentation, která představuje soubor PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");
//Získejte pole objektů ITextFrame ze všech snímků v PPTX
ITextFrame[] textFramesPPTX = Aspose.Slides.Util.SlideUtil.GetAllTextFrames(pptxPresentation, true);
//Procházejte polem TextFrames
for (int i = 0; i < textFramesPPTX.Length; i++)
{
//Procházejte odstavce v aktuálním ITextFrame
foreach (IParagraph para in textFramesPPTX[i].Paragraphs)
{
//Procházejte části v aktuálním IP odstavci
foreach (IPortion port in para.Portions)
{
//Zobrazit text v aktuální části
Console.WriteLine(port.Text);
//Zobrazení výšky písma textu
Console.WriteLine(port.PortionFormat.FontHeight);
//Zobrazit název písma textu
if (port.PortionFormat.LatinFont != null)
Console.WriteLine(port.PortionFormat.LatinFont.FontName);
}
}
}
Získejte bezplatnou licenci API
V případě, že chcete API vyzkoušet bez omezení hodnocení, můžete získat bezplatnou dočasnou licenci.
Závěr
V tomto článku jste se naučili extrahovat text z prezentací PowerPoint. Konkrétně jste viděli, jak extrahovat text z konkrétního snímku nebo celé prezentace pomocí C#. Více o Aspose.Slides for .NET můžete prozkoumat pomocí dokumentace. V případě, že byste měli nějaké dotazy nebo nejasnosti, informujte nás prostřednictvím našeho fóra.