Aranabilir PDF Java'ya Tarandı

Bazen PDF dosyaları, bir tarayıcı veya kamera cihazından alınan resimler kullanılarak oluşturulur. Belirli durumlarda, taranmış bir PDF dosyasını OCR ile aranabilir bir PDF dosyasına dönüştürmeniz gerekebilir, böylece PDF dosyasındaki metin içerikleriyle çalışabilirsiniz. Buna uygun olarak, bu makale taranmış bir PDF’nin Java kullanılarak programlı olarak OCR özelliğiyle aranabilir bir PDF’ye nasıl dönüştürüleceğini kapsar.

Taranan PDF’den OCR ile Aranabilir PDF’e – Java API Kurulumu

Aspose.OCR for Java API kullanarak OCR özelliğiyle bir PDF dosyasındaki metni optik olarak tanıyabilirsiniz. Yeni Çıkanlar bölümünden JAR dosyasını indirerek veya aşağıdaki Maven spesifikasyonlarını kullanarak API’yi kurmanız yeterlidir:

Depo:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Bağımlılık:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

Taranan PDF’yi Java Kullanarak Programlı Olarak Aranabilir PDF’e Dönüştürün

OCR ile taranan bir PDF dosyasının içeriğini tanıyabilirsiniz. Bu, taranmış bir PDF dosyasını aşağıdaki adımlarla Aranabilir bir PDF belgesine dönüştürmenizi sağlar:

  1. Bir AsposeOcr sınıf nesnesi oluşturun.
  2. RecognizePdf yöntemiyle taranan PDF’deki verileri tanıyın.
  3. DocumentRecognitionSettings sınıfını kullanarak OCR tanıma için sayfa numaralarını ayarlayın.
  4. Çıktı OCR sonucunu aranabilir bir PDF dosyası olarak kaydedin.

Aşağıdaki kod parçacığı, taranmış bir PDF’nin Java’da programlı olarak aranabilir bir PDF dosyasına nasıl dönüştürüleceğini açıklamaktadır:

// Taranan çok sayfalı PDF Yolu
String fullPath = "multi_page.pdf";

// AsposeOcr sınıf nesnesini başlat
AsposeOCRPdf api = new AsposeOCRPdf();

DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// PDF'den görüntüleri tanıma           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// Sonucu Aranabilir PDF olarak kaydet
AsposeOCR.SaveMultipageDocument("output.pdf", Format.Pdf, res);

Ücretsiz Değerlendirme Lisansı Alın

Ücretsiz geçici lisans talep ederek, herhangi bir sınırlama olmaksızın OCR işlemleriyle taranan PDF’deki metni tanıma özelliğini değerlendirebilirsiniz.

Çözüm

Bu makalede, Java’da programlı olarak OCR özelliği ile taranan bir PDF dosyasını aranabilir bir PDF belgesine dönüştürmeyi öğrendiniz. Ayrıca, belgeleri ziyaret ederek API’nin OCR ile ilgili diğer özelliklerine göz atabilirsiniz. Herhangi bir endişeniz olması durumunda lütfen forumda bize yazmaktan çekinmeyin.

Ayrıca bakınız