Python'da PowerPoint Dosyalarından Metin Çıkarma

Çeşitli senaryolarda metin, metin analizi, sınıflandırma vb. gibi daha ileri işlemler için belgelerden çıkarılır. PDF ve Word gibi diğer belgelerin yanı sıra PowerPoint dosyaları da metin çıkarmada kullanılır. Bu nedenle, bu makale size Python’da PowerPoint PPT’den nasıl metin çıkarılacağını göstermeyi amaçlamaktadır. Belirli bir slayttan veya tüm sunumdan nasıl metin çıkarılacağını ele alacağız.

PowerPoint PPT’den Metin Çıkarmak için Python Kitaplığı

PowerPoint PPT’den metin çıkarmak için Aspose.Slides for Python via .NET kullanacağız. PowerPoint sunumları oluşturmak ve güncellemek için zengin özelliklere sahip bir Python kitaplığıdır. Ayrıca, sunumları sorunsuz bir şekilde değiştirmenize ve dönüştürmenize olanak tanır. Aşağıdaki pip komutunu kullanarak bu kütüphaneyi PyPI‘den yükleyebilirsiniz.

> pip install aspose.slides 

Python’da PowerPoint PPT’den Metin Çıkarın

Senaryoya bağlı olarak, PowerPoint sunumunun tamamından veya bazı belirli slaytlardan metin çıkarmanız gerekebilir. Aşağıdaki bölümlerde, yukarıda belirtilen her iki durumda da metin çıkarma işleminin nasıl gerçekleştirileceğini göstereceğiz. Öyleyse devam edelim.

Python: Belirli bir PPT Slaytından Metin Çıkarın

Aşağıdakiler, Python’da PPT’de belirli bir slayttan metin çıkarmak için gereken adımlardır.

Aşağıdaki kod örneği, Python’da belirli bir PPT slaydından metnin nasıl çıkarılacağını gösterir.

import aspose.slides as slides

# Sunudaki tüm metni al
text = slides.PresentationFactory().get_presentation_text("presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED)

# Dizini kullanarak istenen slaydın metnini yazdırın
print(text.slides_text[0].text)
print(text.slides_text[0].layout_text)
print(text.slides_text[0].master_text)
print(text.slides_text[0].notes_text)

Python’da Tüm PowerPoint PPT’den Metin Çıkarma

Aşağıdaki adımlar, bir PowerPoint sunumunun tüm slaytlarından metnin nasıl çıkarılacağını gösterir.

Aşağıdaki kod örneği, Python’da bir PPTX (veya PPT) dosyasından nasıl metin çıkarılacağını gösterir.

import aspose.slides as slides

# Sunudaki tüm metni al
text = slides.PresentationFactory().get_presentation_text("presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED)

# Slayt sayısını almak için sunumu yükleyin
with slides.Presentation("presentation.pptx") as ppt:

    # Sunudaki slaytlar arasında geçiş yapın
   for index in range(ppt.slides.length):

        # Slayt metni, düzen metni, notlar vb. gibi istenen bölümlerin metnini yazdırın.
        print(text.slides_text[index].text)
        print(text.slides_text[index].layout_text)
        print(text.slides_text[index].master_text)
        print(text.slides_text[index].notes_text)

Python PPT Metin Çıkarma Kitaplığı - Ücretsiz Lisans Alın

Aspose.Slides for Python’u bir geçici lisans alarak değerlendirme kısıtlamaları olmaksızın kullanabilirsiniz.

Çözüm

Bu makalede, Python’da PowerPoint PPT’den nasıl metin çıkarılacağını öğrendiniz. Bir PowerPoint sunumundaki belirli bir slayttan veya tüm slaytlardan nasıl metin çıkarılacağını gördünüz. Ayrıca belgeleri kullanarak Aspose.Slides for Python’un diğer özelliklerini keşfedebilirsiniz. Ayrıca, sorularınızı forumumuz aracılığıyla bizimle paylaşabilirsiniz.

Ayrıca bakınız