Wyodrębnij tekst z PowerPoint Java

Często może być konieczne wyodrębnienie tekstu ze slajdów programu PowerPoint w celu przeprowadzenia analizy tekstu. Z drugiej strony możesz chcieć wyodrębnić i zapisać tekst w pliku lub bazie danych do dalszego przetwarzania. Zgodnie z tym w tym artykule opisano, jak wyodrębnić tekst z prezentacji programu PowerPoint za pomocą języka Java. W szczególności dowiesz się, jak wyodrębnić tekst z konkretnego slajdu lub całej prezentacji.

Java API do wyodrębniania tekstu z programu PowerPoint PPTX

Aby manipulować prezentacjami PowerPoint, Aspose oferuje Aspose.Slides for Java. Wspomniane API jest przeznaczone do implementacji funkcji automatyzacji programu PowerPoint w aplikacjach Java. Zapewnia również kilka prostych sposobów wyodrębniania tekstu z prezentacji PPT/PPTX. Możesz pobrać interfejs API lub zainstalować go przy użyciu następujących konfiguracji Mavena.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-slides</artifactId>
    <version>21.7</version>
    <classifier>jdk16</classifier>
</dependency>

Wyodrębnij tekst ze slajdu programu PowerPoint w Javie

Poniżej przedstawiono kroki, aby wyodrębnić tekst ze slajdu w prezentacji programu PowerPoint przy użyciu języka Java.

Poniższy przykładowy kod pokazuje, jak wyodrębnić tekst ze slajdu programu PowerPoint.

//Instatiate PresentationEx klasa reprezentująca plik PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");

//Uzyskaj tablicę obiektów ITextFrame z pierwszego slajdu
ITextFrame[] textFramesSlideOne = SlideUtil.getAllTextBoxes(pptxPresentation.getSlides().get_Item(1));

//Zapętlanie tablicy ramek tekstowych
for (int i = 0; i < textFramesSlideOne.length; i++)
{
    //Zapętlaj akapity w bieżącej ramce TextFrame
   for (IParagraph para : textFramesSlideOne[i].getParagraphs())
    {
        //Zapętlaj fragmenty bieżącego akapitu
       for (IPortion port : para.getPortions())
        {
            //Wyświetl tekst w bieżącej części
            System.out.println(port.getText());

            //Wyświetl wysokość czcionki tekstu
            System.out.println(port.getPortionFormat().getFontHeight());

            //Wyświetl nazwę czcionki tekstu
            System.out.println(port.getPortionFormat().getLatinFont().getFontName());
        }
    }
}

Wyodrębnij tekst z całej prezentacji PowerPoint

Możesz także wyodrębnić tekst z całej prezentacji PowerPoint. Poniżej przedstawiono kroki, aby wykonać tę operację.

  • Załaduj prezentację za pomocą klasy Presentation.
  • Pobierz wszystkie ramki tekstowe w prezentacji za pomocą metody SlideUtil.getAllTextFrames().
  • Przejdź przez każdą ITextFrame i uzyskaj dostęp do jej akapitów.
  • Uzyskaj dostęp do części akapitów i wydrukuj ich tekst.

Poniższy przykładowy kod pokazuje, jak wyodrębnić tekst z prezentacji programu PowerPoint.

//Instatiate PresentationEx klasa reprezentująca plik PPTX
Presentation pptxPresentation = new Presentation("presentation.pptx");

//Uzyskaj tablicę obiektów ITextFrame z pierwszego slajdu
ITextFrame[] textFrames = SlideUtil.getAllTextFrames(pptxPresentation, true);

//Zapętlanie tablicy ramek tekstowych
for (int i = 0; i < textFrames.length; i++)
{
    //Zapętlaj akapity w bieżącej ramce TextFrame
   for (IParagraph para : textFrames[i].getParagraphs())
    {
        //Zapętlaj fragmenty bieżącego akapitu
       for (IPortion port : para.getPortions())
        {
            //Wyświetl tekst w bieżącej części
            System.out.println(port.getText());
        }
    }
}

Uzyskaj bezpłatną licencję API

Jeśli chcesz korzystać z API bez ograniczeń ewaluacyjnych, możesz uzyskać bezpłatną tymczasową licencję.

Wypróbuj online

Możesz także wypróbować darmowy parser prezentacji online, który został opracowany przy użyciu Aspose.Slides.

Wniosek

W tym artykule nauczyłeś się, jak wyodrębnić tekst z prezentacji programu PowerPoint przy użyciu języka Java. Przykłady kodu pokazały, jak wyodrębnić tekst z określonego slajdu lub całej prezentacji. Możesz dowiedzieć się więcej o Aspose.Slides for Java, korzystając z dokumentacji. W przypadku jakichkolwiek pytań prosimy o kontakt za pośrednictwem naszego forum.

Zobacz też