OCR PDF Python'u

Taranmış PDF belgeleri, aranabilir veya düzenlenebilir metin içermemeleri nedeniyle genellikle üzerinde çalışmak zordur. Ancak, Optik Karakter Tanıma (OCR) teknolojisinin gücüyle, taranan PDF’lerden metin çıkarmak ve bunları aranabilir veya düzenlenebilir biçimlere dönüştürmek bir gerçek haline geliyor. Bu blog yazısında Python’da OCR ile PDF metin tanımayı nasıl yapacağınızı öğreneceksiniz. Ayrıca taranan PDF dosyalarından metin çıkarmayı, bunları aranabilir veya düzenlenebilir PDF’lere dönüştürmeyi ve Aspose.OCR for Python via .NET kitaplığını kullanarak Python’un OCR yeteneklerinin potansiyelini nasıl ortaya çıkaracağımızı keşfedeceğiz.

OCR ile Taranmış PDF’deki Metni Tanıma – Python API Kurulumu

Optik Karakter Tanıma (OCR), görüntülerin veya taranan belgelerin makine tarafından okunabilir metne dönüştürülmesine olanak tanıyan bir teknolojidir. OCR algoritmaları, bir görüntüdeki karakterlerin şekillerini ve kalıplarını analiz ederek, metni tanımlayıp tanıyarak, içindeki bilgilerin çıkarılmasını ve işlenmesini mümkün kılar. Başlamadan önce, Aspose.OCR for Python’u New Releases sayfasından indirerek .NET aracılığıyla kurmanız veya aşağıdaki kurulum komutunu çalıştırarak PyPi üzerinden yapılandırmanız gerekir:

pip install aspose-ocr-python-net

Python’da OCR ile PDF’deki Metni Tanıma

Python’da OCR ile PDF’den metin tanıyabilir veya ayıklayabilirsiniz. Aşağıdaki adımlar, Python’da OCR ile PDF’den metin tanımaya yönelik basit süreci özetlediğinden, taranmış bir PDF belgesinden metni verimli bir şekilde çıkaracaktır:

  1. AsposeOcr sınıfından bir nesne oluşturun.
  2. Taranan PDF dosyasını yükleyin.
  3. Metni OCR ile tanıyın ve çıktıyı konsola yazdırın.

Aşağıdaki örnek kod, Python’da OCR ile PDF’deki metnin nasıl tanınacağını gösterir:

import aspose.ocr as ocr

# Initialize an object of AsposeOcr class
api = ocr.AsposeOcr()

# Load the scanned PDF file
input = ocr.OcrInput(ocr.InputType.PDF)
input.add("source.pdf")

# Recognize text with OCR
result = api.recognize(input)

# Print the output text to the console
print(result[0].recognition_text)

Taranan PDF’yi Python’da OCR ile Aranabilir veya Düzenlenebilir PDF’ye Dönüştürün

Taranan PDF dosyaları, metni arayamayacağınız görüntüler içerir, bu nedenle belgeyi makine tarafından okunabilir hale getirmek ve buna göre daha fazla işlemek için aranabilir bir PDF belgesine dönüştürmeniz gerekir. Python’da aranabilir veya düzenlenebilir bir PDF belgesine dönüştürmek için lütfen aşağıdaki adımları izleyin:

  1. AsposeOcr sınıfından bir nesne oluşturun.
  2. [RecognitionSettings][5] sınıf örneğini başlatın ve gerekli özellikleri ayarlayın.
  3. PDF dosyasını yükleyin ve OCR ile tanınmak için sayfa aralığını ayarlayın.
  4. Çıktı aranabilir PDF dosyasını kaydedin.

Aşağıdaki örnek kod, taranan bir PDF’nin Python’da OCR ile aranabilir bir PDF belgesine nasıl dönüştürüleceğini gösterir:

import aspose.ocr as ocr

api = ocr.AsposeOcr()

# Initialize RecognitionSettings
settings = ocr.RecognitionSettings()
settings.auto_denoising = True
settings.auto_contrast = True

# Specify the PDF document as input
input = ocr.OcrInput(ocr.InputType.PDF)

# Access the scanned PDF and set the page number and total number of pages
input.add("source.pdf", 0, 1)

# Process the PDF file for text recognition with OCR
result = api.recognize(input , settings)

# Save the searchable output PDF file
api.save_multipage_document("searchable.pdf", ocr.SaveFormat.PDF, result)

Burada, PDF belgesindeki herhangi bir sayfa aralığında OCR yapabileceğiniz dikkat çekicidir. Örneğin, yalnızca sayfa dizininin sıfır tabanlı olduğu ve son parametrenin API ile işlenecek sayfa sayısının sayısı olduğu durumlarda belirli sayfalardan metin tanıma. Ek olarak, OCR ile metnin gelişmiş ve hassas bir şekilde tanınması için kaynak dosyanın ön işlemesi için gürültüyü giderme, kontrastı ayarlama, giriş sayfalarının eğriliğini kontrol etme vb. gibi farklı Tanıma ayarları belirleyebilirsiniz.

Ücretsiz Değerlendirme Lisansı Alın

API’yi herhangi bir değerlendirme sınırlaması olmadan değerlendirmek için bir ücretsiz geçici lisans talep edebilirsiniz.

Özetliyor

OCR teknolojisinin ve Python’un gücüyle, taranan PDF’lerden metin çıkarmak ve bunları aranabilir veya düzenlenebilir biçimlere dönüştürmek oldukça erişilebilir hale geldi. Burada Python’da OCR ile PDF metin tanıma sürecini inceledik. Yükleme sürecini ve taranmış PDF’lerden metin çıkarmayı, OCR uygulamasını ve taranan PDF’lerin aranabilir veya düzenlenebilir biçimlere dönüştürülmesini tartıştık. OCR yeteneklerinden yararlanarak ve gelişmiş teknikler kullanarak, taranmış PDF’lerin tüm potansiyelini açığa çıkarabilir ve projelerinizde onları daha erişilebilir ve çok yönlü hale getirebilirsiniz. Herhangi bir belirsizlik veya soru olması durumunda lütfen ücretsiz destek forumu aracılığıyla bize ulaşın.

Ayrıca bakınız