Taranan PDF'den Excel OCR'ye

Taranan PDF dosyaları, görüntü biçiminde veriler içerir ve bazen bu tür belgelerden bilgilere ihtiyaç duyabilirsiniz. Belirli durumlarda, taranmış bir PDF dosyası, Excel’de değiştirilmesi gerekebilecek sayısal bilgiler içerebilir. Buna göre OCR işlemlerini yapabilir ve Excel dosyası oluşturabilirsiniz. Bu makale, C# kullanarak programlı olarak OCR özelliğine sahip taranmış bir PDF’den Excel’e dönüştürücünün nasıl oluşturulacağını kapsar.

OCR – C# API Kurulumu ile Taranan PDF’den Excel’e Dönüştürücü Oluşturun

Aspose.OCR for .NET API tarafından sunulan OCR özellikleriyle çalışabilirsiniz. Yeni Çıkanlar bölümünden DLL dosyasını indirerek veya aşağıdaki NuGet kurulum komutunu kullanarak OCR ile kolayca taranmış bir PDF’den Excel’e dönüştürücü oluşturabilirsiniz:

PM> Install-Package Aspose.OCR

Taranmış PDF’yi Programlı Olarak C# ile Excel’e Dönüştürün

Aşağıdaki adımları izleyerek taranmış bir PDF belgesini OCR ile bir Excel dosyasına dönüştürebilirsiniz:

  1. AsposeOcr sınıf nesnesinin örneğini oluşturun.
  2. Bir DocumentRecognitionSettings sınıf nesnesi belirtin.
  3. RecognizePdf yöntemiyle taranan PDF dosyasını tanıyın.
  4. Çıkış Excel dosyasını SaveMultipageDocument yöntemini kullanarak kaydedin.

Aşağıdaki kod örneği, taranan bir PDF’nin C# kullanarak Excel’e nasıl dönüştürüleceğini açıklar:

// Taranan PDF dosya yolu
string path = "Scanned.pdf";

// AsposeOcr calss nesnesini başlat
AsposeOcr api = new AsposeOcr();

// PDF dosyasını tanımak için ayarları belirtin
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;

// Taranan PDF dosyasındaki sayfaları tanıyın
List<RecognitionResult> res = api.RecognizePdf(path , settings);

// Çıktı sonucunu XLSX biçiminde bir Excel dosyası olarak kaydedin
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);

Ücretsiz Değerlendirme Lisansı Alın

Ücretsiz geçici lisans talep ederek, taranan PDF’yi tam kapasitesiyle Excel’e dönüştürme özelliğini değerlendirebilirsiniz.

Çözüm

Bu makalede, taranan bir PDF dosyasının, metni optik olarak tanımak için OCR işlemlerini uygulayarak Excel’e nasıl dönüştürüleceğini incelediniz. Bu, bir CSV dosyasının bir tarayıcı tarafından taranması ve bir PDF dosyasının üretilmesi gibi senaryolarda yardımcı olabilir. C# kullanarak programlı olarak bir Excel dosyasına dönüştürebilirsiniz. Ayrıca, belgeleri inceleyerek API tarafından sunulan OCR ile ilgili diğer özelliklere göz atabilirsiniz. Herhangi bir sorunuz olması durumunda, lütfen forumdan bizimle iletişime geçmekten çekinmeyin.

Ayrıca bakınız