Python'da OCR PDF ve PDF'den Metin Çıkarma

Optik Karakter Tanıma (OCR) teknolojisi, PDF belgeler de dahil olmak üzere çeşitli kaynaklardan alınan basılı, taranmış veya el yazısı metinlerin dijitalleştirilmesinde çok önemli bir rol oynar. Bu blog yazısında Python’da PDF belgelerinin nasıl OCR’landığını ve PDF’den metin çıkarmayı öğreneceğiz.

Bu makale aşağıdaki konuları kapsamaktadır:

  1. PDF’den TXT Python OCR API’sine
  2. OCR PDF ve PDF’den Metin Çıkarma
  3. Taranan PDF’yi Metne Kaydet
  4. Ücretsiz Öğrenme Kaynakları

PDF’den TXT’ye - Python OCR API’si

PDF belgelerinde OCR gerçekleştirmek ve PDF’lerden metin çıkarmak için Aspose.OCR for Python‘ı kullanacağız. Aspose.OCR for Python, taranan görüntülerden, akıllı telefon fotoğraflarından, ekran görüntülerinden ve görüntü alanlarındaki metinleri tanıyabilen güçlü bir optik karakter tanıma (OCR) API’sidir. API, tanınan metin sonuçlarını PDF, XML, JSON ve düz metin dahil en popüler belge ve veri alışverişi formatlarında döndürür.

Aspose.OCR for Python, görüntüleri metne dönüştürmenin yanı sıra taramalara dayalı olarak aranabilir PDF’ler de oluşturabilir. API ayrıca tanınan metinlerdeki yazım hatalarını otomatik olarak düzeltebilir ve bu da onu çeşitli uygulamalar için ideal kılar.

Lütfen paketi indirin veya konsolda aşağıdaki pip komutunu kullanarak API’yi PyPI adresinden yükleyin:

pip install aspose-ocr-python-net

Python OCR PDF - Python’da PDF’den Metin Çıkarma

Aşağıdaki adımları izleyerek PDF belgeleri üzerinde OCR gerçekleştirebilir ve tanınan metni çıkartabiliriz:

  1. AsposeOcr sınıfının bir örneğini oluşturun.
  2. DocumentRecognitionSettings sınıfının bir nesnesini başlatın.
  3. Tanıma grubuna PDF dosyası ekleyin.
  4. Bundan sonra, tanı() yöntemini çağırın.
  5. Son olarak, Tanımlanan metni RecognitionResult sınıfını kullanarak gösterin.

Aşağıdaki örnek kod, Python’da PDF belgelerinin nasıl OCR’ye dönüştürüleceğini ve PDF’den nasıl metin çıkarılacağını gösterir.

# Bu kod örneği, Python'da taranmış bir PDF belgesindeki metnin nasıl tanınacağını ve çıkarılacağını gösterir.
import aspose.ocr as ocr

# OCR motorunu başlat
api = ocr.AsposeOcr()

# RecognitionSettings'i Başlat
settings = ocr.RecognitionSettings()
settings.auto_denoising = True
settings.auto_contrast = True

# Tanıma grubuna dosya ekle
files = ocr.OcrInput(ocr.InputType.PDF)

# Taranan PDF'ye erişin ve sayfa numarasını ve toplam sayfa sayısını ayarlayın
files.add("C:\\Files\\sample.pdf", 0, 1)

# Metni tanı
result = api.recognize(files , settings)

# Tanıma sonucunu yazdır
print(result[0].recognition_text)

Python OCR PDF - Taranan PDF’yi Python’da Metne Kaydetme

Aşağıdaki adımları izleyerek PDF belgeleri üzerinde OCR gerçekleştirebilir ve tanınan metni kaydedebiliriz:

  1. AsposeOcr sınıfının bir örneğini oluşturun.
  2. DocumentRecognitionSettings sınıfının bir nesnesini başlatın.
  3. Tanıma grubuna PDF dosyası ekleyin.
  4. Bundan sonra, tanı() yöntemini çağırın.
  5. Son olarak savemultipagedocument() yöntemini kullanarak metni kaydedin. Bağımsız değişken olarak çıktı dosyası yolunu, SaveFormat ve RecognitionResult nesnesini alır.

Aşağıdaki örnek kod, PDF belgelerinin nasıl OCR’ye dönüştürüleceğini ve tanınan metnin Python’da nasıl kaydedileceğini gösterir.

# Bu kod örneği, Python kullanarak tanıma ve ayıklama metninin nasıl kaydedileceğini gösterir.
import aspose.ocr as ocr

# OCR motorunu başlat
api = ocr.AsposeOcr()

# RecognitionSettings'i Başlat
settings = ocr.RecognitionSettings()
settings.auto_denoising = True
settings.auto_contrast = True

# Tanıma grubuna dosya ekle
files = ocr.OcrInput(ocr.InputType.PDF)

# Taranan PDF'ye erişin ve sayfa numarasını ve toplam sayfa sayısını ayarlayın
files.add("C:\\Files\\sample.pdf", 0, 1)

# Metni tanı
result = api.recognize(files , settings)

# Tanıma sonucunu yazdır
print(result[0].recognition_text)

# Çıkarılan metni kaydedin
api.save_multipage_document("C:\\Files\\sample_out.txt", ocr.SaveFormat.TEXT, result)

Ücretsiz Değerlendirme Lisansı Alın

Kütüphaneyi değerlendirme sınırlamaları olmadan denemek için ücretsiz bir geçici lisans alabilirsiniz.

Python OCR PDF - Ücretsiz Kaynaklar

Python OCR API’sini öğrenmek için aşağıdaki kaynakları daha ayrıntılı olarak inceleyebilirsiniz:

Çözüm

Bu yazıda Python’da PDF belgelerinde OCR yapmayı ve PDF’den metin çıkarmayı öğrendik. OCR kullanarak PDF’lerden metin çıkarma yeteneği, arşivleme ve yasal belgelemeden veri analizi ve içerik dijitalleştirmeye kadar birçok sektörde ezber bozan bir özelliktir. Geliştiriciler ve meraklılar, Aspose.OCR for Python’u kullanarak OCR özelliklerini Python projelerine sorunsuz bir şekilde entegre edebilirler. Herhangi bir belirsizlik durumunda lütfen ücretsiz destek forumumuz üzerinden bizimle iletişime geçmekten çekinmeyin.

Ayrıca bakınız