Ekstrak Teks dari PowerPoint C#

Anda mungkin sering perlu mengekstrak teks dari slide PowerPoint untuk melakukan analisis teks. Di sisi lain, Anda mungkin ingin mengekstrak dan menyimpan teks dalam file atau database untuk diproses lebih lanjut. Sejalan dengan itu, artikel ini membahas cara mengekstrak teks dari presentasi PowerPoint menggunakan C#. Khususnya, Anda akan mempelajari cara mengekstrak teks dari slide tertentu atau seluruh presentasi.

C# API untuk Mengekstrak Teks dari PowerPoint PPTX

Untuk memanipulasi presentasi PowerPoint, Aspose menawarkan Aspose.Slides for .NET. API tersebut dirancang untuk mengimplementasikan fitur otomatisasi PowerPoint dalam aplikasi .NET. Ini juga menyediakan beberapa cara sederhana untuk mengekstraksi teks dari presentasi PPTX. Anda dapat mengunduh API atau menginstalnya menggunakan NuGet.

PM> Install-Package Aspose.Slides.NET

Ekstrak Teks dari Slide PowerPoint di C#

Berikut ini adalah langkah-langkah untuk mengekstrak teks dari slide dalam presentasi PowerPoint.

Contoh kode berikut menunjukkan cara mengekstrak teks dari slide PowerPoint menggunakan C#.

//Buat kelas PresentationEx yang mewakili file PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");

//Dapatkan objek Array TextFrameEx dari slide pertama
ITextFrame[] textFramesSlideOne = SlideUtil.GetAllTextBoxes(pptxPresentation.Slides[0]);

//Ulangi Array dari TextFrames
for (int i = 0; i < textFramesSlideOne.Length; i++)
{
    //Ulangi paragraf dalam TextFrame saat ini
    foreach (Paragraph para in textFramesSlideOne[i].Paragraphs)
    {
        //Ulangi bagian-bagian dalam Paragraf saat ini
        foreach (Portion port in para.Portions)
        {
            //Tampilkan teks di bagian saat ini
            Console.WriteLine(port.Text);

            //Menampilkan tinggi font teks
            Console.WriteLine(port.PortionFormat.FontHeight);

            //Tampilkan nama font teks
            Console.WriteLine(port.PortionFormat.LatinFont.FontName);
        }
    }
}

Ekstrak Teks dari Presentasi PowerPoint di C#

Anda juga dapat mengekstrak teks dari seluruh presentasi PowerPoint menggunakan Aspose.Slides for .NET. Berikut ini adalah langkah-langkah untuk melakukan operasi ini.

Contoh kode berikut menunjukkan cara mengekstrak teks dari presentasi PowerPoint.

//Kelas Presentasi Instatiate yang mewakili file PPTX
Presentation pptxPresentation = new Presentation("demo.pptx");

//Dapatkan Array objek ITextFrame dari semua slide di PPTX
ITextFrame[] textFramesPPTX = Aspose.Slides.Util.SlideUtil.GetAllTextFrames(pptxPresentation, true);

//Ulangi Array dari TextFrames
for (int i = 0; i < textFramesPPTX.Length; i++)
{
	//Ulangi paragraf di ITextFrame saat ini
	foreach (IParagraph para in textFramesPPTX[i].Paragraphs)
	{
		//Ulangi bagian-bagian dalam IParagraph saat ini
		foreach (IPortion port in para.Portions)
		{
			//Tampilkan teks di bagian saat ini
			Console.WriteLine(port.Text);

			//Menampilkan tinggi font teks
			Console.WriteLine(port.PortionFormat.FontHeight);

			//Tampilkan nama font teks
			if (port.PortionFormat.LatinFont != null)
				Console.WriteLine(port.PortionFormat.LatinFont.FontName);
		}
	}
}

Dapatkan Lisensi API Gratis

Jika Anda ingin mencoba API tanpa batasan evaluasi, Anda bisa mendapatkan lisensi sementara gratis.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengekstrak teks dari presentasi PowerPoint. Khususnya, Anda telah melihat cara mengekstrak teks dari slide tertentu atau seluruh presentasi menggunakan C#. Anda dapat menjelajahi lebih lanjut tentang Aspose.Slides for .NET menggunakan dokumentasi. Jika Anda memiliki pertanyaan atau kebingungan, beri tahu kami melalui forum kami.

Lihat juga