Memindai PDF agar Dapat Ditelusuri dengan OCR di C#

File PDF terkadang didasarkan pada gambar yang biasanya dibuat menggunakan pemindai atau perangkat pencitraan. Anda dapat mengonversi file PDF yang dipindai menjadi file PDF yang dapat dicari dengan OCR sehingga teks dapat diedit atau diperbarui dalam dokumen. Sesuai dengan skenario tersebut, artikel ini menjelaskan cara mengonversi PDF yang dipindai menjadi PDF yang dapat dicari dengan operasi OCR secara terprogram menggunakan C#.

Memindai PDF ke PDF yang Dapat Dicari dengan Instalasi OCR – C# API

Anda dapat melakukan operasi OCR pada file PDF yang dipindai dengan Aspose.OCR for .NET API. Cukup konfigurasikan API dengan mengunduh file DLL dari bagian Rilis Baru, atau menggunakan perintah penginstalan NuGet berikut:

PM> Install-Package Aspose.OCR

Ubah PDF yang Dipindai menjadi PDF yang Dapat Dicari Secara terprogram menggunakan C#

Anda dapat mengonversi file PDF yang dipindai menjadi dokumen PDF yang Dapat Dicari sambil mengenali teks secara optik dengan mengikuti langkah-langkah di bawah ini:

  1. Inisialisasi instance kelas AsposeOcr.
  2. Kenali gambar dari PDF menggunakan metode RecognizePdf.
  3. Tetapkan properti yang berbeda untuk pengenalan OCR dengan kelas DocumentRecognitionSettings.
  4. Simpan hasil OCR sebagai file PDF yang dapat dicari.

Cuplikan kode di bawah ini menjelaskan cara mengonversi PDF yang dipindai menjadi dokumen PDF yang dapat dicari secara terprogram menggunakan C#:

// Jalur PDF multi halaman yang dipindai
string fullPath = "multi_page.pdf";

// Inisialisasi objek kelas AsposeOcr
AsposeOcr api = new AsposeOcr();

// Kenali gambar dari PDF           
List<RecognitionResult> res = api.RecognizePdf(fullPath, new DocumentRecognitionSettings
{
    StartPage = 0,
    PagesNumber = 1
});

// Simpan hasil sebagai PDF yang Dapat Dicari
AsposeOcr.SaveMultipageDocument("output.pdf", SaveFormat.Pdf, res);

Dapatkan Lisensi Evaluasi Gratis

Anda dapat mengevaluasi fitur untuk mengenali teks dalam PDF yang dipindai dengan operasi OCR tanpa batasan apa pun dengan meminta lisensi sementara gratis.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengonversi file PDF yang dipindai menjadi dokumen PDF yang dapat dicari dengan melakukan operasi OCR secara terprogram dalam C#. Selain itu, Anda dapat memeriksa beberapa fitur terkait OCR lainnya yang ditawarkan oleh API dengan mengunjungi dokumentasi. Jangan ragu untuk menghubungi kami di forum jika ada pertanyaan.

Lihat juga