Es posible que a menudo necesite extraer texto de las diapositivas de PowerPoint para realizar un análisis de texto. Por otro lado, es posible que desee extraer y guardar el texto en un archivo o base de datos para su posterior procesamiento. De acuerdo con eso, este artículo cubre cómo extraer texto de presentaciones de PowerPoint usando C#. En particular, aprenderá cómo extraer texto de una diapositiva específica o de una presentación completa.
- API para extraer texto de PowerPoint PPTX
- Extraer texto de una diapositiva de PowerPoint
- Extraer texto de una presentación de PowerPoint
- Obtenga una licencia de API gratuita
API de C# para extraer texto de PowerPoint PPTX
Para manipular presentaciones de PowerPoint, Aspose ofrece Aspose.Slides for .NET. Dicha API está diseñada para implementar funciones de automatización de PowerPoint en aplicaciones .NET. También proporciona algunas formas sencillas de extraer texto de las presentaciones PPTX. Puede descargar la API o instalarla mediante NuGet.
PM> Install-Package Aspose.Slides.NET
Extraer texto de una diapositiva de PowerPoint en C#
Los siguientes son los pasos para extraer texto de una diapositiva en una presentación de PowerPoint.
- Cargue la presentación usando la clase Presentation.
- Obtenga todos los marcos de texto de una diapositiva en la matriz ITextFrame usando el método SlideUtil.GetAllTextBoxes().
- Recorra cada ITextFrame y acceda a su texto usando la propiedad ITextFrame.Paragraphs.
- Recuperar e imprimir texto de cada Porción del párrafo.
El siguiente ejemplo de código muestra cómo extraer texto de una diapositiva de PowerPoint usando C#.
//Crear instancias de la clase PresentationEx que representa un archivo PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");
//Obtenga una matriz de objetos TextFrameEx de la primera diapositiva
ITextFrame[] textFramesSlideOne = SlideUtil.GetAllTextBoxes(pptxPresentation.Slides[0]);
//Bucle a través de la matriz de TextFrames
for (int i = 0; i < textFramesSlideOne.Length; i++)
{
//Recorrer los párrafos en el TextFrame actual
foreach (Paragraph para in textFramesSlideOne[i].Paragraphs)
{
//Bucle a través de porciones en el párrafo actual
foreach (Portion port in para.Portions)
{
//Mostrar texto en la parte actual
Console.WriteLine(port.Text);
//Mostrar la altura de la fuente del texto
Console.WriteLine(port.PortionFormat.FontHeight);
//Mostrar el nombre de la fuente del texto
Console.WriteLine(port.PortionFormat.LatinFont.FontName);
}
}
}
Extraiga texto de una presentación de PowerPoint en C#
También puede extraer texto de toda la presentación de PowerPoint utilizando Aspose.Slides for .NET. Los siguientes son los pasos para realizar esta operación.
- Cargue la presentación usando la clase Presentation.
- Obtenga todos los marcos de texto en la presentación usando el método SlideUtil.GetAllTextFrames().
- Recorra cada ITextFrame y acceda a sus Párrafos.
- Acceda a las porciones de los párrafos e imprima su texto.
El siguiente ejemplo de código muestra cómo extraer texto de una presentación de PowerPoint.
//Crear una clase de presentación que representa un archivo PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");
//Obtenga una matriz de objetos ITextFrame de todas las diapositivas en el PPTX
ITextFrame[] textFramesPPTX = Aspose.Slides.Util.SlideUtil.GetAllTextFrames(pptxPresentation, true);
//Bucle a través de la matriz de TextFrames
for (int i = 0; i < textFramesPPTX.Length; i++)
{
//Recorrer los párrafos en el ITextFrame actual
foreach (IParagraph para in textFramesPPTX[i].Paragraphs)
{
//Bucle a través de porciones en el IParagraph actual
foreach (IPortion port in para.Portions)
{
//Mostrar texto en la parte actual
Console.WriteLine(port.Text);
//Mostrar la altura de la fuente del texto
Console.WriteLine(port.PortionFormat.FontHeight);
//Mostrar el nombre de la fuente del texto
if (port.PortionFormat.LatinFont != null)
Console.WriteLine(port.PortionFormat.LatinFont.FontName);
}
}
}
Obtenga una licencia de API gratuita
En caso de que quiera probar la API sin limitaciones de evaluación, puede obtener una licencia temporal gratuita.
Conclusión
En este artículo, ha aprendido a extraer texto de presentaciones de PowerPoint. En particular, ha visto cómo extraer texto de una diapositiva específica o de toda la presentación usando C#. Puede explorar más sobre Aspose.Slides for .NET usando documentación. En caso de que tenga alguna duda o confusión, infórmenos a través de nuestro foro.