Memindai PDF ke Excel OCR Java

File PDF yang dipindai terdiri dari data dalam format gambar karena sering dibuat oleh pemindai. Dalam situasi tertentu, Anda mungkin memerlukan informasi numerik dari file PDF yang dipindai. Jadi Anda dapat melakukan operasi OCR untuk membuat file Excel. Artikel ini membahas cara membuat konverter PDF ke Excel yang dipindai dengan fitur OCR secara terprogram di Java.

Buat PDF yang dipindai ke Excel Converter dengan OCR - Instalasi Java API

Anda dapat mengenali teks secara optik dalam file PDF dengan fitur OCR menggunakan Aspose.OCR for Java API. Cukup instal API dengan mengunduh file JAR dari bagian Rilis Baru, atau menggunakan spesifikasi Maven di bawah:

Gudang:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Ketergantungan:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

Konversikan PDF yang dipindai ke Excel Secara terprogram di Java

Anda dapat mengonversi file PDF yang dipindai ke Excel dengan OCR dengan mengikuti langkah-langkah di bawah ini:

  1. Buat objek kelas AsposeOcr.
  2. Tentukan pengaturan dengan kelas DocumentRecognitionSettings.
  3. Kenali file PDF yang dipindai menggunakan metode RecognizePdf.
  4. Simpan hasil keluaran OCR sebagai file Excel.

Cuplikan kode berikut menguraikan cara mengonversi PDF yang dipindai ke file Excel secara terprogram di Java:

// Jalur file PDF yang dipindai
String fullPath = "scanned.pdf";

// Inisialisasi objek kelas AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();

// Menginisialisasi objek kelas DocumentRecognitionSettings
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// Kenali gambar dari PDF           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// Simpan hasilnya sebagai file Excel XLSX
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);

Dapatkan Lisensi Evaluasi Gratis

Anda dapat mengevaluasi API untuk membuat pengonversi PDF ke Excel yang dipindai dengan operasi OCR tanpa batasan apa pun dengan meminta lisensi sementara gratis.

Kesimpulan

Pada artikel ini, Anda telah memahami cara mengonversi file PDF yang dipindai menjadi file Excel dengan fitur OCR secara terprogram di Java. Selain itu, silakan lihat fitur terkait OCR lainnya dengan mengunjungi dokumentasi. Jangan ragu untuk menulis kepada kami di forum jika ada masalah.

Lihat juga