Ekstrak Teks dari PowerPoint Java

Anda mungkin sering perlu mengekstrak teks dari slide PowerPoint untuk melakukan analisis teks. Di sisi lain, Anda mungkin ingin mengekstrak dan menyimpan teks dalam file atau database untuk diproses lebih lanjut. Sejalan dengan itu, artikel ini membahas cara mengekstrak teks dari presentasi PowerPoint menggunakan Java. Khususnya, Anda akan mempelajari cara mengekstrak teks dari slide tertentu atau seluruh presentasi.

Java API untuk Mengekstrak Teks dari PowerPoint PPTX

Untuk memanipulasi presentasi PowerPoint, Aspose menawarkan Aspose.Slides for Java. API tersebut dirancang untuk mengimplementasikan fitur otomatisasi PowerPoint dalam aplikasi Java. Ini juga menyediakan beberapa cara sederhana untuk mengekstraksi teks dari presentasi PPT/PPTX. Anda dapat mengunduh API atau menginstalnya menggunakan konfigurasi Maven berikut.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-slides</artifactId>
    <version>21.7</version>
    <classifier>jdk16</classifier>
</dependency>

Ekstrak Teks dari Slide PowerPoint di Java

Berikut ini adalah langkah-langkah untuk mengekstrak teks dari slide dalam presentasi PowerPoint menggunakan Java.

Contoh kode berikut menunjukkan cara mengekstrak teks dari slide PowerPoint.

//Buat kelas PresentationEx yang mewakili file PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");

//Dapatkan Array objek ITextFrame dari slide pertama
ITextFrame[] textFramesSlideOne = SlideUtil.getAllTextBoxes(pptxPresentation.getSlides().get_Item(1));

//Ulangi Array dari TextFrames
for (int i = 0; i < textFramesSlideOne.length; i++)
{
    //Ulangi paragraf dalam TextFrame saat ini
   for (IParagraph para : textFramesSlideOne[i].getParagraphs())
    {
        //Ulangi bagian-bagian dalam Paragraf saat ini
       for (IPortion port : para.getPortions())
        {
            //Tampilkan teks di bagian saat ini
            System.out.println(port.getText());

            //Menampilkan tinggi font teks
            System.out.println(port.getPortionFormat().getFontHeight());

            //Tampilkan nama font teks
            System.out.println(port.getPortionFormat().getLatinFont().getFontName());
        }
    }
}

Ekstrak Teks dari Seluruh Presentasi PowerPoint

Anda juga dapat mengekstrak teks dari seluruh presentasi PowerPoint. Berikut ini adalah langkah-langkah untuk melakukan operasi ini.

Contoh kode berikut menunjukkan cara mengekstrak teks dari presentasi PowerPoint.

//Buat kelas PresentationEx yang mewakili file PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");

//Dapatkan Array objek ITextFrame dari slide pertama
ITextFrame[] textFrames = SlideUtil.getAllTextFrames(pptxPresentation, true);

//Ulangi Array dari TextFrames
for (int i = 0; i < textFrames.length; i++)
{
    //Ulangi paragraf dalam TextFrame saat ini
   for (IParagraph para : textFrames[i].getParagraphs())
    {
        //Ulangi bagian-bagian dalam Paragraf saat ini
       for (IPortion port : para.getPortions())
        {
            //Tampilkan teks di bagian saat ini
            System.out.println(port.getText());
        }
    }
}

Dapatkan Lisensi API Gratis

Jika Anda ingin menggunakan API tanpa batasan evaluasi, Anda bisa mendapatkan lisensi sementara gratis.

Coba Daring

Anda juga dapat mencoba parser presentasi online gratis, yang dikembangkan menggunakan Aspose.Slides.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengekstrak teks dari presentasi PowerPoint menggunakan Java. Contoh kode telah menunjukkan cara mengekstrak teks dari slide tertentu atau seluruh presentasi. Anda dapat mempelajari lebih lanjut tentang Aspose.Slides for Java menggunakan dokumentasi. Jika Anda memiliki pertanyaan, beri tahu kami melalui forum kami.

Lihat juga