Anda mungkin sering perlu mengekstrak teks dari slide PowerPoint untuk melakukan analisis teks. Di sisi lain, Anda mungkin ingin mengekstrak dan menyimpan teks dalam file atau database untuk diproses lebih lanjut. Sejalan dengan itu, artikel ini membahas cara mengekstrak teks dari presentasi PowerPoint menggunakan Java. Khususnya, Anda akan mempelajari cara mengekstrak teks dari slide tertentu atau seluruh presentasi.
- API untuk Mengekstrak Teks dari PowerPoint PPTX
- Ekstrak Teks dari Slide PowerPoint
- Ekstrak Teks dari Presentasi PowerPoint
Java API untuk Mengekstrak Teks dari PowerPoint PPTX
Untuk memanipulasi presentasi PowerPoint, Aspose menawarkan Aspose.Slides for Java. API tersebut dirancang untuk mengimplementasikan fitur otomatisasi PowerPoint dalam aplikasi Java. Ini juga menyediakan beberapa cara sederhana untuk mengekstraksi teks dari presentasi PPT/PPTX. Anda dapat mengunduh API atau menginstalnya menggunakan konfigurasi Maven berikut.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-slides</artifactId>
<version>21.7</version>
<classifier>jdk16</classifier>
</dependency>
Ekstrak Teks dari Slide PowerPoint di Java
Berikut ini adalah langkah-langkah untuk mengekstrak teks dari slide dalam presentasi PowerPoint menggunakan Java.
- Muat presentasi menggunakan kelas Presentation.
- Dapatkan semua bingkai teks dari slide ke dalam larik ITextFrame menggunakan metode SlideUtil.getAllTextBoxes().
- Ulangi setiap ITextFrame dan akses teksnya menggunakan metode ITextFrame.getParagraphs().
- Ambil dan cetak teks dari setiap IPortion paragraf.
Contoh kode berikut menunjukkan cara mengekstrak teks dari slide PowerPoint.
//Buat kelas PresentationEx yang mewakili file PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");
//Dapatkan Array objek ITextFrame dari slide pertama
ITextFrame[] textFramesSlideOne = SlideUtil.getAllTextBoxes(pptxPresentation.getSlides().get_Item(1));
//Ulangi Array dari TextFrames
for (int i = 0; i < textFramesSlideOne.length; i++)
{
//Ulangi paragraf dalam TextFrame saat ini
for (IParagraph para : textFramesSlideOne[i].getParagraphs())
{
//Ulangi bagian-bagian dalam Paragraf saat ini
for (IPortion port : para.getPortions())
{
//Tampilkan teks di bagian saat ini
System.out.println(port.getText());
//Menampilkan tinggi font teks
System.out.println(port.getPortionFormat().getFontHeight());
//Tampilkan nama font teks
System.out.println(port.getPortionFormat().getLatinFont().getFontName());
}
}
}
Ekstrak Teks dari Seluruh Presentasi PowerPoint
Anda juga dapat mengekstrak teks dari seluruh presentasi PowerPoint. Berikut ini adalah langkah-langkah untuk melakukan operasi ini.
- Muat presentasi menggunakan kelas Presentation.
- Dapatkan semua bingkai teks dalam presentasi menggunakan metode SlideUtil.getAllTextFrames().
- Ulangi setiap ITextFrame dan akses paragrafnya.
- Akses bagian paragraf dan cetak teksnya.
Contoh kode berikut menunjukkan cara mengekstrak teks dari presentasi PowerPoint.
//Buat kelas PresentationEx yang mewakili file PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");
//Dapatkan Array objek ITextFrame dari slide pertama
ITextFrame[] textFrames = SlideUtil.getAllTextFrames(pptxPresentation, true);
//Ulangi Array dari TextFrames
for (int i = 0; i < textFrames.length; i++)
{
//Ulangi paragraf dalam TextFrame saat ini
for (IParagraph para : textFrames[i].getParagraphs())
{
//Ulangi bagian-bagian dalam Paragraf saat ini
for (IPortion port : para.getPortions())
{
//Tampilkan teks di bagian saat ini
System.out.println(port.getText());
}
}
}
Dapatkan Lisensi API Gratis
Jika Anda ingin menggunakan API tanpa batasan evaluasi, Anda bisa mendapatkan lisensi sementara gratis.
Coba Daring
Anda juga dapat mencoba parser presentasi online gratis, yang dikembangkan menggunakan Aspose.Slides.
Kesimpulan
Pada artikel ini, Anda telah mempelajari cara mengekstrak teks dari presentasi PowerPoint menggunakan Java. Contoh kode telah menunjukkan cara mengekstrak teks dari slide tertentu atau seluruh presentasi. Anda dapat mempelajari lebih lanjut tentang Aspose.Slides for Java menggunakan dokumentasi. Jika Anda memiliki pertanyaan, beri tahu kami melalui forum kami.