Wyodrębnij tekst z programu PowerPoint C#

Często może być konieczne wyodrębnienie tekstu ze slajdów programu PowerPoint w celu przeprowadzenia analizy tekstu. Z drugiej strony możesz chcieć wyodrębnić i zapisać tekst w pliku lub bazie danych do dalszego przetwarzania. Zgodnie z tym w tym artykule opisano, jak wyodrębnić tekst z prezentacji programu PowerPoint przy użyciu języka C#. W szczególności dowiesz się, jak wyodrębnić tekst z konkretnego slajdu lub całej prezentacji.

C# API do wyodrębniania tekstu z programu PowerPoint PPTX

Aby manipulować prezentacjami PowerPoint, Aspose oferuje Aspose.Slides for .NET. Wspomniane API jest przeznaczone do implementacji funkcji automatyzacji programu PowerPoint w aplikacjach .NET. Zapewnia również kilka prostych sposobów wyodrębniania tekstu z prezentacji PPTX. Możesz pobrać interfejs API lub zainstalować go za pomocą NuGet.

PM> Install-Package Aspose.Slides.NET

Wyodrębnij tekst ze slajdu programu PowerPoint w języku C#

Poniżej przedstawiono kroki, aby wyodrębnić tekst ze slajdu w prezentacji programu PowerPoint.

Poniższy przykładowy kod pokazuje, jak wyodrębnić tekst ze slajdu programu PowerPoint przy użyciu języka C#.

//Instatiate PresentationEx klasa reprezentująca plik PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");

//Uzyskaj tablicę obiektów TextFrameEx z pierwszego slajdu
ITextFrame[] textFramesSlideOne = SlideUtil.GetAllTextBoxes(pptxPresentation.Slides[0]);

//Zapętlanie tablicy ramek tekstowych
for (int i = 0; i < textFramesSlideOne.Length; i++)
{
    //Zapętlaj akapity w bieżącej ramce TextFrame
    foreach (Paragraph para in textFramesSlideOne[i].Paragraphs)
    {
        //Zapętlaj fragmenty bieżącego akapitu
        foreach (Portion port in para.Portions)
        {
            //Wyświetl tekst w bieżącej części
            Console.WriteLine(port.Text);

            //Wyświetl wysokość czcionki tekstu
            Console.WriteLine(port.PortionFormat.FontHeight);

            //Wyświetl nazwę czcionki tekstu
            Console.WriteLine(port.PortionFormat.LatinFont.FontName);
        }
    }
}

Wyodrębnij tekst z prezentacji PowerPoint w C#

Możesz także wyodrębnić tekst z całej prezentacji PowerPoint za pomocą Aspose.Slides for .NET. Poniżej przedstawiono kroki, aby wykonać tę operację.

Poniższy przykładowy kod pokazuje, jak wyodrębnić tekst z prezentacji programu PowerPoint.

//Klasa Instatiate Presentation reprezentująca plik PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");

//Uzyskaj tablicę obiektów ITextFrame ze wszystkich slajdów w PPTX
ITextFrame[] textFramesPPTX = Aspose.Slides.Util.SlideUtil.GetAllTextFrames(pptxPresentation, true);

//Zapętlanie tablicy ramek tekstowych
for (int i = 0; i < textFramesPPTX.Length; i++)
{
	//Zapętlaj akapity w bieżącym ITextFrame
	foreach (IParagraph para in textFramesPPTX[i].Paragraphs)
	{
		//Zapętlaj fragmenty w bieżącym Iparagrafie
		foreach (IPortion port in para.Portions)
		{
			//Wyświetl tekst w bieżącej części
			Console.WriteLine(port.Text);

			//Wyświetl wysokość czcionki tekstu
			Console.WriteLine(port.PortionFormat.FontHeight);

			//Wyświetl nazwę czcionki tekstu
			if (port.PortionFormat.LatinFont != null)
				Console.WriteLine(port.PortionFormat.LatinFont.FontName);
		}
	}
}

Uzyskaj bezpłatną licencję API

Jeśli chcesz wypróbować interfejs API bez ograniczeń ewaluacyjnych, możesz uzyskać bezpłatną tymczasową licencję.

Wniosek

W tym artykule nauczyłeś się, jak wyodrębnić tekst z prezentacji PowerPoint. W szczególności widziałeś, jak wyodrębnić tekst z określonego slajdu lub całej prezentacji za pomocą C#. Możesz dowiedzieć się więcej o Aspose.Slides for .NET za pomocą dokumentacji. W przypadku jakichkolwiek pytań lub niejasności, poinformuj nas o tym za pośrednictwem naszego forum.

Zobacz też