Nhận dạng văn bản DjVu Image C# OCR

Định dạng DjVu được sử dụng để lưu trữ các tài liệu đã quét vì chúng có thể bao gồm văn bản, hình ảnh hoặc bản vẽ. DjVu được sử dụng để lưu trữ dữ liệu vì nó có thể lưu trữ dữ liệu bằng cách sử dụng không gian tối thiểu. Bài viết này trình bày cách nhận dạng văn bản từ hình ảnh DjVu với các hoạt động OCR được lập trình trong C#.

Nhận dạng văn bản từ hình ảnh DjVu - Cài đặt API C#

API Aspose.OCR for .NET hỗ trợ nhận dạng ký tự quang học cho các loại tài liệu khác nhau như JPG, PNG, PDF, v.v. Tương tự, nó cũng hỗ trợ nhận dạng văn bản từ các tệp hình ảnh DjVu nhiều trang. Bạn có thể dễ dàng định cấu hình API bằng cách tải xuống tệp JAR của API từ phần Tải xuống. Tương tự như vậy, bạn có thể chạy lệnh cài đặt NuGet sau để cài đặt thư viện trong dự án của mình:

PM> Install-Package Aspose.OCR

Nhận dạng văn bản bằng cách thực hiện OCR trên DjVu Image trong C#

Bạn có thể nhận dạng văn bản bằng cách thực hiện các thao tác OCR trên nhiều trang DjVu hình ảnh bằng cách làm theo các bước bên dưới:

  1. Khởi tạo phiên bản API bằng cách sử dụng lớp AsposeOCR.
  2. Tạo một đối tượng lớp DocumentRecognitionSettings.
  3. Nhận dạng văn bản bằng phương pháp RecognizeDjvu.
  4. In văn bản được nhận dạng.

Mẫu mã sau đây cho thấy cách nhận dạng văn bản từ hình ảnh DjVu bằng cách thực hiện OCR theo chương trình trong C#:

// Nhập đường dẫn tệp hình ảnh DJVU
string imgPath = "sample1.djvu";

// Khởi tạo đối tượng lớp AsposeOcr
AsposeOcr api = new AsposeOcr();

// Nhận dạng hình ảnh từ DJVU
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.PagesNumber = 0;
List<Aspose.OCR.RecognitionResult> result = api.RecognizeDjvu(imgPath, set);

// In kết quả
int pageNumber = 0;
foreach (var page in result)
{
    System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}

Nhận giấy phép API miễn phí

Bạn có thể yêu cầu Giấy phép tạm thời miễn phí để đánh giá API mà không có bất kỳ giới hạn đánh giá nào.

Sự kết luận

Tóm lại, bạn đã học cách nhận dạng văn bản bằng các thao tác OCR trên hình ảnh DjVu nhiều trang. Bạn có thể nhận dạng văn bản với khả năng chỉ định cài đặt nhận dạng tài liệu, nơi bạn có thể đặt các tùy chọn độ tương phản và nghiêng tự động cho hình ảnh đầu vào để tăng độ chính xác của quá trình nhận dạng văn bản. Hơn nữa, bạn có thể khám phá nhiều tính năng khác được API hỗ trợ bằng cách xem phần tài liệu. Trong trường hợp bạn cần thảo luận về bất kỳ mối quan tâm hoặc yêu cầu nào của mình, vui lòng viết thư cho chúng tôi tại diễn đàn.

Xem thêm

Chuyển đổi hình ảnh sang Excel với OCR trong C#