Często może być konieczne wyodrębnienie tekstu ze slajdów programu PowerPoint w celu przeprowadzenia analizy tekstu. Z drugiej strony możesz chcieć wyodrębnić i zapisać tekst w pliku lub bazie danych do dalszego przetwarzania. Zgodnie z tym w tym artykule opisano, jak wyodrębnić tekst z prezentacji programu PowerPoint za pomocą języka Java. W szczególności dowiesz się, jak wyodrębnić tekst z konkretnego slajdu lub całej prezentacji.
- API do wyodrębniania tekstu z programu PowerPoint PPTX
- Wyodrębnij tekst ze slajdu programu PowerPoint
- Wyodrębnij tekst z prezentacji PowerPoint
Java API do wyodrębniania tekstu z programu PowerPoint PPTX
Aby manipulować prezentacjami PowerPoint, Aspose oferuje Aspose.Slides for Java. Wspomniane API jest przeznaczone do implementacji funkcji automatyzacji programu PowerPoint w aplikacjach Java. Zapewnia również kilka prostych sposobów wyodrębniania tekstu z prezentacji PPT/PPTX. Możesz pobrać interfejs API lub zainstalować go przy użyciu następujących konfiguracji Mavena.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-slides</artifactId>
<version>21.7</version>
<classifier>jdk16</classifier>
</dependency>
Wyodrębnij tekst ze slajdu programu PowerPoint w Javie
Poniżej przedstawiono kroki, aby wyodrębnić tekst ze slajdu w prezentacji programu PowerPoint przy użyciu języka Java.
- Załaduj prezentację za pomocą klasy Presentation.
- Pobierz wszystkie ramki tekstowe ze slajdu do tablicy ITextFrame za pomocą metody SlideUtil.getAllTextBoxes().
- Przejdź przez każdą ramkę ITextFrame i uzyskaj dostęp do jej tekstu za pomocą metody ITextFrame.getParagraphs().
- Pobierz i wydrukuj tekst z każdego IPortion akapitu.
Poniższy przykładowy kod pokazuje, jak wyodrębnić tekst ze slajdu programu PowerPoint.
//Instatiate PresentationEx klasa reprezentująca plik PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");
//Uzyskaj tablicę obiektów ITextFrame z pierwszego slajdu
ITextFrame[] textFramesSlideOne = SlideUtil.getAllTextBoxes(pptxPresentation.getSlides().get_Item(1));
//Zapętlanie tablicy ramek tekstowych
for (int i = 0; i < textFramesSlideOne.length; i++)
{
//Zapętlaj akapity w bieżącej ramce TextFrame
for (IParagraph para : textFramesSlideOne[i].getParagraphs())
{
//Zapętlaj fragmenty bieżącego akapitu
for (IPortion port : para.getPortions())
{
//Wyświetl tekst w bieżącej części
System.out.println(port.getText());
//Wyświetl wysokość czcionki tekstu
System.out.println(port.getPortionFormat().getFontHeight());
//Wyświetl nazwę czcionki tekstu
System.out.println(port.getPortionFormat().getLatinFont().getFontName());
}
}
}
Wyodrębnij tekst z całej prezentacji PowerPoint
Możesz także wyodrębnić tekst z całej prezentacji PowerPoint. Poniżej przedstawiono kroki, aby wykonać tę operację.
- Załaduj prezentację za pomocą klasy Presentation.
- Pobierz wszystkie ramki tekstowe w prezentacji za pomocą metody SlideUtil.getAllTextFrames().
- Przejdź przez każdą ITextFrame i uzyskaj dostęp do jej akapitów.
- Uzyskaj dostęp do części akapitów i wydrukuj ich tekst.
Poniższy przykładowy kod pokazuje, jak wyodrębnić tekst z prezentacji programu PowerPoint.
//Instatiate PresentationEx klasa reprezentująca plik PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");
//Uzyskaj tablicę obiektów ITextFrame z pierwszego slajdu
ITextFrame[] textFrames = SlideUtil.getAllTextFrames(pptxPresentation, true);
//Zapętlanie tablicy ramek tekstowych
for (int i = 0; i < textFrames.length; i++)
{
//Zapętlaj akapity w bieżącej ramce TextFrame
for (IParagraph para : textFrames[i].getParagraphs())
{
//Zapętlaj fragmenty bieżącego akapitu
for (IPortion port : para.getPortions())
{
//Wyświetl tekst w bieżącej części
System.out.println(port.getText());
}
}
}
Uzyskaj bezpłatną licencję API
Jeśli chcesz korzystać z API bez ograniczeń ewaluacyjnych, możesz uzyskać bezpłatną tymczasową licencję.
Wypróbuj online
Możesz także wypróbować darmowy parser prezentacji online, który został opracowany przy użyciu Aspose.Slides.
Wniosek
W tym artykule nauczyłeś się, jak wyodrębnić tekst z prezentacji programu PowerPoint przy użyciu języka Java. Przykłady kodu pokazały, jak wyodrębnić tekst z określonego slajdu lub całej prezentacji. Możesz dowiedzieć się więcej o Aspose.Slides for Java, korzystając z dokumentacji. W przypadku jakichkolwiek pytań prosimy o kontakt za pośrednictwem naszego forum.