Excel'e Taranan PDF OCR Java

Taranan PDF dosyaları, genellikle tarayıcılar tarafından oluşturuldukları için görüntü biçimindeki verileri içerir. Belirli durumlarda, taranmış bir PDF dosyasından sayısal bilgilere ihtiyaç duyabilirsiniz. Böylece bir Excel dosyası oluşturmak için OCR işlemlerini gerçekleştirebilirsiniz. Bu makale, Java’da programlı olarak OCR özelliğine sahip taranmış bir PDF’den Excel’e dönüştürücünün nasıl oluşturulacağını kapsar.

OCR – Java API Kurulumu ile Taranan PDF’den Excel’e Dönüştürücü Oluşturun

Aspose.OCR for Java API kullanarak OCR özelliğiyle bir PDF dosyasındaki metni optik olarak tanıyabilirsiniz. Yeni Çıkanlar bölümünden JAR dosyasını indirerek veya aşağıdaki Maven spesifikasyonlarını kullanarak API’yi kurmanız yeterlidir:

Depo:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Bağımlılık:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

Taranan PDF’yi Java’da Programlı Olarak Excel’e Dönüştürün

Aşağıdaki adımları izleyerek taranmış bir PDF dosyasını OCR ile Excel’e dönüştürebilirsiniz:

  1. Bir AsposeOcr sınıf nesnesi oluşturun.
  2. DocumentRecognitionSettings sınıfı ile ayarları belirtin.
  3. RecognizePdf yöntemini kullanarak taranan PDF dosyasını tanıyın.
  4. Çıktı OCR sonucunu bir Excel dosyası olarak kaydedin.

Aşağıdaki kod parçacığı, taranan bir PDF’nin Java’da programlı olarak bir Excel dosyasına nasıl dönüştürüleceğini açıklamaktadır:

// Taranan PDF dosya yolu
String fullPath = "scanned.pdf";

// AsposeOcr sınıf nesnesini başlat
AsposeOCRPdf api = new AsposeOCRPdf();

// DocumentRecognitionSettings sınıf nesnesini başlat
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// PDF'den görüntüleri tanıma           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// Sonucu Excel XLSX dosyası olarak kaydet
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);

Ücretsiz Değerlendirme Lisansı Alın

Ücretsiz geçici lisans talep ederek herhangi bir sınırlama olmaksızın OCR işlemleriyle taranmış PDF’den Excel’e dönüştürücü oluşturmak için API’yi değerlendirebilirsiniz.

Çözüm

Bu yazıda, Java’da programlı olarak OCR özelliği ile taranan bir PDF dosyasını bir Excel dosyasına nasıl dönüştüreceğinizi anladınız. Ayrıca, lütfen belgeleri ziyaret ederek OCR ile ilgili diğer özelliklere göz atın. Herhangi bir endişeniz olması durumunda forumda bize yazmaktan çekinmeyin.

Ayrıca bakınız