Çeşitli senaryolarda metin, metin analizi, sınıflandırma vb. gibi daha ileri işlemler için belgelerden çıkarılır. PDF ve Word gibi diğer belgelerin yanı sıra PowerPoint dosyaları da metin çıkarmada kullanılır. Bu nedenle, bu makale size Python’da PowerPoint PPT’den nasıl metin çıkarılacağını göstermeyi amaçlamaktadır. Belirli bir slayttan veya tüm sunumdan nasıl metin çıkarılacağını ele alacağız.
PowerPoint PPT’den Metin Çıkarmak için Python Kitaplığı
PowerPoint PPT’den metin çıkarmak için Aspose.Slides for Python via .NET kullanacağız. PowerPoint sunumları oluşturmak ve güncellemek için zengin özelliklere sahip bir Python kitaplığıdır. Ayrıca, sunumları sorunsuz bir şekilde değiştirmenize ve dönüştürmenize olanak tanır. Aşağıdaki pip komutunu kullanarak bu kütüphaneyi PyPI‘den yükleyebilirsiniz.
> pip install aspose.slides
Python’da PowerPoint PPT’den Metin Çıkarın
Senaryoya bağlı olarak, PowerPoint sunumunun tamamından veya bazı belirli slaytlardan metin çıkarmanız gerekebilir. Aşağıdaki bölümlerde, yukarıda belirtilen her iki durumda da metin çıkarma işleminin nasıl gerçekleştirileceğini göstereceğiz. Öyleyse devam edelim.
Python: Belirli bir PPT Slaytından Metin Çıkarın
Aşağıdakiler, Python’da PPT’de belirli bir slayttan metin çıkarmak için gereken adımlardır.
İlk olarak, sunumdaki tüm metin türlerini almak için PresentationFactory().getpresentationtext(string, TextExtractionArrangingMode) yöntemini kullanın.
Bundan sonra, belirli bir slaydın metnini slidestext dizisinden çıkarmak için dizini kullanın.
Ayıklayabileceğiniz metin türleri şunlardır:
Slayt Metni
notlar
Slayt düzeni metni
Asıl metni kaydır
Aşağıdaki kod örneği, Python’da belirli bir PPT slaydından metnin nasıl çıkarılacağını gösterir.
import aspose.slides as slides
# Sunudaki tüm metni al
text = slides.PresentationFactory().get_presentation_text("presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED)
# Dizini kullanarak istenen slaydın metnini yazdırın
print(text.slides_text[0].text)
print(text.slides_text[0].layout_text)
print(text.slides_text[0].master_text)
print(text.slides_text[0].notes_text)
Python’da Tüm PowerPoint PPT’den Metin Çıkarma
Aşağıdaki adımlar, bir PowerPoint sunumunun tüm slaytlarından metnin nasıl çıkarılacağını gösterir.
- İlk olarak, sunumdaki tüm metin türlerini almak için PresentationFactory().getpresentationtext(string, TextExtractionArrangingMode) yöntemini kullanın.
- Bir Sunum nesnesine sunum yükleyin.
- Sunudaki slayt sayısını yineleyin.
- Slidestext dizisini kullanarak her slayttan metin ayıklayın.
Aşağıdaki kod örneği, Python’da bir PPTX (veya PPT) dosyasından nasıl metin çıkarılacağını gösterir.
import aspose.slides as slides
# Sunudaki tüm metni al
text = slides.PresentationFactory().get_presentation_text("presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED)
# Slayt sayısını almak için sunumu yükleyin
with slides.Presentation("presentation.pptx") as ppt:
# Sunudaki slaytlar arasında geçiş yapın
for index in range(ppt.slides.length):
# Slayt metni, düzen metni, notlar vb. gibi istenen bölümlerin metnini yazdırın.
print(text.slides_text[index].text)
print(text.slides_text[index].layout_text)
print(text.slides_text[index].master_text)
print(text.slides_text[index].notes_text)
Python PPT Metin Çıkarma Kitaplığı - Ücretsiz Lisans Alın
Aspose.Slides for Python’u bir geçici lisans alarak değerlendirme kısıtlamaları olmaksızın kullanabilirsiniz.
Çözüm
Bu makalede, Python’da PowerPoint PPT’den nasıl metin çıkarılacağını öğrendiniz. Bir PowerPoint sunumundaki belirli bir slayttan veya tüm slaytlardan nasıl metin çıkarılacağını gördünüz. Ayrıca belgeleri kullanarak Aspose.Slides for Python’un diğer özelliklerini keşfedebilirsiniz. Ayrıca, sorularınızı forumumuz aracılığıyla bizimle paylaşabilirsiniz.