Extraer texto de PowerPoint C#

Es posible que a menudo necesite extraer texto de las diapositivas de PowerPoint para realizar un análisis de texto. Por otro lado, es posible que desee extraer y guardar el texto en un archivo o base de datos para su posterior procesamiento. De acuerdo con eso, este artículo cubre cómo extraer texto de presentaciones de PowerPoint usando C#. En particular, aprenderá cómo extraer texto de una diapositiva específica o de una presentación completa.

API de C# para extraer texto de PowerPoint PPTX

Para manipular presentaciones de PowerPoint, Aspose ofrece Aspose.Slides for .NET. Dicha API está diseñada para implementar funciones de automatización de PowerPoint en aplicaciones .NET. También proporciona algunas formas sencillas de extraer texto de las presentaciones PPTX. Puede descargar la API o instalarla mediante NuGet.

PM> Install-Package Aspose.Slides.NET

Extraer texto de una diapositiva de PowerPoint en C#

Los siguientes son los pasos para extraer texto de una diapositiva en una presentación de PowerPoint.

El siguiente ejemplo de código muestra cómo extraer texto de una diapositiva de PowerPoint usando C#.

//Crear instancias de la clase PresentationEx que representa un archivo PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");

//Obtenga una matriz de objetos TextFrameEx de la primera diapositiva
ITextFrame[] textFramesSlideOne = SlideUtil.GetAllTextBoxes(pptxPresentation.Slides[0]);

//Bucle a través de la matriz de TextFrames
for (int i = 0; i < textFramesSlideOne.Length; i++)
{
    //Recorrer los párrafos en el TextFrame actual
    foreach (Paragraph para in textFramesSlideOne[i].Paragraphs)
    {
        //Bucle a través de porciones en el párrafo actual
        foreach (Portion port in para.Portions)
        {
            //Mostrar texto en la parte actual
            Console.WriteLine(port.Text);

            //Mostrar la altura de la fuente del texto
            Console.WriteLine(port.PortionFormat.FontHeight);

            //Mostrar el nombre de la fuente del texto
            Console.WriteLine(port.PortionFormat.LatinFont.FontName);
        }
    }
}

Extraiga texto de una presentación de PowerPoint en C#

También puede extraer texto de toda la presentación de PowerPoint utilizando Aspose.Slides for .NET. Los siguientes son los pasos para realizar esta operación.

El siguiente ejemplo de código muestra cómo extraer texto de una presentación de PowerPoint.

//Crear una clase de presentación que representa un archivo PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");

//Obtenga una matriz de objetos ITextFrame de todas las diapositivas en el PPTX
ITextFrame[] textFramesPPTX = Aspose.Slides.Util.SlideUtil.GetAllTextFrames(pptxPresentation, true);

//Bucle a través de la matriz de TextFrames
for (int i = 0; i < textFramesPPTX.Length; i++)
{
	//Recorrer los párrafos en el ITextFrame actual
	foreach (IParagraph para in textFramesPPTX[i].Paragraphs)
	{
		//Bucle a través de porciones en el IParagraph actual
		foreach (IPortion port in para.Portions)
		{
			//Mostrar texto en la parte actual
			Console.WriteLine(port.Text);

			//Mostrar la altura de la fuente del texto
			Console.WriteLine(port.PortionFormat.FontHeight);

			//Mostrar el nombre de la fuente del texto
			if (port.PortionFormat.LatinFont != null)
				Console.WriteLine(port.PortionFormat.LatinFont.FontName);
		}
	}
}

Obtenga una licencia de API gratuita

En caso de que quiera probar la API sin limitaciones de evaluación, puede obtener una licencia temporal gratuita.

Conclusión

En este artículo, ha aprendido a extraer texto de presentaciones de PowerPoint. En particular, ha visto cómo extraer texto de una diapositiva específica o de toda la presentación usando C#. Puede explorar más sobre Aspose.Slides for .NET usando documentación. En caso de que tenga alguna duda o confusión, infórmenos a través de nuestro foro.

Ver también