Chuyển đổi JPG sang Word với OCR

OCR là một công nghệ có thể được sử dụng để trích xuất văn bản từ hình ảnh. Điều này có thể hữu ích cho nhiều tác vụ, chẳng hạn như chuyển đổi tài liệu được quét thành văn bản có thể chỉnh sửa, trích xuất văn bản từ hình ảnh để lập chỉ mục tìm kiếm, v.v. Trong bài đăng trên blog này, chúng ta sẽ tìm hiểu cách phát triển trình chuyển đổi JPG sang Word bằng OCR bằng C#. Trình chuyển đổi của chúng tôi sẽ thực hiện nhận dạng ký tự quang học (OCR) trên hình ảnh JPG và văn bản được trích xuất sẽ được lưu dưới dạng tài liệu Word ở định dạng DOCX.

Các chủ đề sau sẽ được đề cập trong bài viết này:

C# JPG to Word Converter OCR API – Tải xuống miễn phí

Khi chuyển đổi JPG thành Word, chúng tôi sẽ khai thác Aspose.OCR for .NET API. Đó là API Nhận dạng ký tự quang học (OCR) mạnh mẽ cho phép các nhà phát triển trích xuất văn bản từ hình ảnh một cách chính xác. Được hỗ trợ bởi các phương pháp xử lý hình ảnh chất lượng cao, Aspose.OCR for .NET không giới hạn ở JPG. Nó cũng có thể xác định và trích xuất văn bản từ các loại hình ảnh khác như TIFF, PNG và BMP mà không gặp bất kỳ sự cố nào. Do đó, nó là một công cụ tự động hóa lý tưởng để số hóa tài liệu, xử lý hóa đơn và hợp lý hóa việc nhập dữ liệu.

Vui lòng tải xuống DLL của API hoặc cài đặt nó bằng NuGet.

PM> Install-Package Aspose.OCR

Chuyển đổi hình ảnh JPG sang Word bằng C#

Chúng tôi có thể dễ dàng chuyển đổi hình ảnh JPG sang tài liệu Word theo chương trình bằng cách thực hiện theo các bước bên dưới:

  1. Tạo một thể hiện của lớp OcrInput với InputType làm đối số.
  2. Chỉ định hình ảnh JPG để chuyển đổi.
  3. Khởi tạo một đối tượng lớp AsposeOcr.
  4. Sau đó, gọi phương thức Nhận dạng() với OcrInput làm đối số.
  5. Cuối cùng, lưu kết quả dưới dạng tệp DOCX.

Mẫu mã sau đây cho biết cách chuyển đổi tài liệu JPG sang Word bằng C#.

// Ví dụ mã này trình bày cách chuyển đổi JPG sang Word trong C#.
using Aspose.OCR;

// Đường dẫn hình ảnh
var image = "C:\\Files\\sample.jpg";

// Chỉ định đầu vào OCR
var input = new OcrInput(InputType.SingleImage)
{
    image
};

// Khởi tạo một phiên bản của AsposeOcr
AsposeOcr api = new AsposeOcr();

// Nhận dạng hình ảnh           
var result = api.Recognize(input);

// Lưu kết quả dưới dạng tệp DOCX
foreach(var item in result)
{
    item.Save("C:\\Files\\JPGtoDOCX.docx", SaveFormat.Docx);
}
Chuyển đổi JPG sang Word trong C#.

Chuyển đổi JPG sang Word trong C#.

Chuyển đổi OCR JPG sang Word – Nhận giấy phép miễn phí

Bạn có thể lấy giấy phép tạm thời miễn phí để dùng thử thư viện Aspose.OCR để đánh giá việc chuyển đổi hình ảnh JPG thành tài liệu Word mà không có bất kỳ giới hạn nào.

Chuyển đổi JPG sang Word Với OCR – Tài nguyên Học tập

Bạn có thể tìm hiểu thêm về Aspose.OCR for .NET và khám phá nhiều tính năng khác của API bằng cách sử dụng tài nguyên được cung cấp bên dưới:

Chuyển đổi hình ảnh thành văn bản trực tuyến miễn phí

Bạn có thể trích xuất văn bản từ hình ảnh JPG trực tuyến miễn phí bằng cách sử dụng trình chuyển đổi hình ảnh thành văn bản của chúng tôi, được phát triển bằng API này. Vui lòng truy cập công cụ trực tuyến miễn phí trong trình duyệt của bạn bằng liên kết sau:

https://api.products.aspose.app/ocr/en/scan-image

Phần kết luận

Trong bài đăng trên blog này, chúng tôi đã học cách phát triển trình chuyển đổi JPG sang Word bằng OCR bằng C#. Trình chuyển đổi của chúng tôi có thể được sử dụng để trích xuất văn bản từ hình ảnh JPG và lưu văn bản đã trích xuất vào tài liệu Word. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn hỗ trợ miễn phí của chúng tôi.

Xem thêm