Đã quét PDF sang Excel OCR

Các tệp PDF được quét chứa dữ liệu ở định dạng hình ảnh và đôi khi bạn có thể cần thông tin từ các tài liệu đó. Trong một số trường hợp nhất định, tệp PDF được quét có thể chứa thông tin số có thể cần được thao tác trong Excel. Theo đó, bạn có thể thực hiện các thao tác OCR và tạo tệp Excel. Bài viết này trình bày cách tạo trình chuyển đổi PDF sang Excel được quét bằng tính năng OCR theo cách lập trình bằng C#.

Tạo công cụ chuyển đổi PDF sang Excel được quét với OCR - Cài đặt API C#

Bạn có thể làm việc với các tính năng OCR do API Aspose.OCR for .NET cung cấp. Bạn có thể dễ dàng tạo trình chuyển đổi PDF sang Excel được quét bằng OCR bằng cách tải xuống tệp DLL từ phần Bản phát hành mới hoặc bằng lệnh cài đặt NuGet bên dưới:

PM> Install-Package Aspose.OCR

Chuyển đổi PDF đã quét sang Excel theo phương pháp lập trình trong C#

Bạn có thể chuyển đổi tài liệu PDF được quét sang tệp Excel bằng OCR bằng cách làm theo các bước bên dưới:

  1. Khởi tạo đối tượng lớp AsposeOcr.
  2. Chỉ định một đối tượng lớp DocumentRecognitionSettings.
  3. Nhận dạng tệp PDF đã quét bằng phương pháp RecognizePdf.
  4. Lưu tệp Excel đầu ra bằng phương pháp SaveMultipageDocument.

Mẫu mã sau giải thích cách chuyển đổi một tệp PDF được quét sang Excel bằng C#:

// Đường dẫn tệp PDF được quét
string path = "Scanned.pdf";

// Khởi tạo đối tượng calss AsposeOcr
AsposeOcr api = new AsposeOcr();

// Chỉ định cài đặt để nhận dạng tệp PDF
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;

// Nhận dạng các trang từ tệp PDF được quét
List<RecognitionResult> res = api.RecognizePdf(path , settings);

// Lưu kết quả đầu ra dưới dạng tệp Excel ở định dạng XLSX
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);

Nhận Giấy phép Đánh giá Miễn phí

Bạn có thể đánh giá tính năng chuyển đổi PDF đã quét sang Excel ở mức đầy đủ của nó bằng cách yêu cầu giấy phép tạm thời miễn phí.

Sự kết luận

Trong bài viết này, bạn đã kiểm tra cách chuyển đổi một tệp PDF được quét sang Excel bằng cách áp dụng các hoạt động OCR để nhận dạng văn bản theo phương pháp quang học. Điều này có thể hữu ích trong các tình huống như khi tệp CSV được quét bởi máy quét và tệp PDF được tạo. Bạn có thể chuyển đổi nó thành tệp Excel theo cách lập trình bằng C#. Hơn nữa, bạn có thể xem các tính năng khác liên quan đến OCR do API cung cấp bằng cách xem qua tài liệu. Trong trường hợp có bất kỳ thắc mắc nào, vui lòng liên hệ với chúng tôi tại diễn đàn.

Xem thêm