C#'ta OCR ile Aranabilir Olarak Taranan PDF

PDF dosyaları bazen, genellikle bir tarayıcı veya görüntüleme cihazı kullanılarak oluşturulan görüntüleri temel alır. Metnin belgede düzenlenebilmesi veya güncellenebilmesi için taranmış bir PDF dosyasını OCR ile aranabilir bir PDF dosyasına dönüştürebilirsiniz. Bu senaryoya uygun olarak, bu makale taranan bir PDF’nin C# kullanılarak programlı olarak OCR işlemleriyle aranabilir bir PDF’ye nasıl dönüştürüleceğini açıklamaktadır.

OCR ile Taranan PDF’den Aranabilir PDF’e – C# API Kurulumu

Aspose.OCR for .NET API ile taranmış bir PDF dosyası üzerinde OCR işlemleri gerçekleştirebilirsiniz. Yeni Sürümler bölümünden DLL dosyasını indirerek veya aşağıdaki NuGet kurulum komutunu kullanarak API’yi yapılandırmanız yeterlidir:

PM> Install-Package Aspose.OCR

Taranmış PDF’yi C# kullanarak Programlı Olarak Aranabilir PDF’ye Dönüştürün

Aşağıdaki adımları izleyerek metni optik olarak tanırken taranmış bir PDF dosyasını Aranabilir bir PDF belgesine dönüştürebilirsiniz:

  1. AsposeOcr sınıf örneğini başlatın.
  2. RecognizePdf yöntemini kullanarak PDF’deki görüntüleri tanıyın.
  3. DocumentRecognitionSettings sınıfıyla OCR tanıma için farklı özellikler ayarlayın.
  4. OCR sonucunu aranabilir bir PDF dosyası olarak kaydedin.

Aşağıdaki kod parçacığı, taranan bir PDF’nin C# kullanarak programlı olarak aranabilir bir PDF belgesine nasıl dönüştürüleceğini açıklar:

// Taranan çok sayfalı PDF Yolu
string fullPath = "multi_page.pdf";

// AsposeOcr sınıf nesnesini başlat
AsposeOcr api = new AsposeOcr();

// PDF'den görüntüleri tanıma           
List<RecognitionResult> res = api.RecognizePdf(fullPath, new DocumentRecognitionSettings
{
    StartPage = 0,
    PagesNumber = 1
});

// Sonucu Aranabilir PDF olarak kaydet
AsposeOcr.SaveMultipageDocument("output.pdf", SaveFormat.Pdf, res);

Ücretsiz Değerlendirme Lisansı Alın

Ücretsiz geçici lisans talep ederek, herhangi bir sınırlama olmaksızın OCR işlemleriyle taranan PDF’deki metni tanıma özelliğini değerlendirebilirsiniz.

Çözüm

Bu makalede, taranmış bir PDF dosyasını C# ile programlı olarak üzerinde OCR işlemleri gerçekleştirerek aranabilir bir PDF belgesine dönüştürmeyi öğrendiniz. Ayrıca, belgeleri ziyaret ederek API tarafından sunulan OCR ile ilgili diğer bazı özellikleri kontrol edebilirsiniz. Herhangi bir sorunuz olması durumunda lütfen forum üzerinden bizimle iletişime geçmekten çekinmeyin.

Ayrıca bakınız