Chuyển đổi hình ảnh sang Word DOCX OCR

Bạn có thể chuyển đổi hình ảnh chứa văn bản thành tài liệu từ có thể chỉnh sửa (DOCX) bằng cách sử dụng C#. Ví dụ: bạn cần chuyển đổi hình ảnh được chụp từ máy quét hoặc máy ảnh sang tài liệu có thể chỉnh sửa, sau đó bạn cần thực hiện OCR trên hình ảnh đầu vào. Bạn có thể xem thêm chi tiết trong các phần sau:

Chuyển đổi tài liệu hình ảnh sang tài liệu Word (DOCX) trong C# - Cài đặt

API Aspose.OCR cho .NET có thể được sử dụng để nhận dạng văn bản từ hình ảnh. Nó hỗ trợ chuyển đổi hình ảnh sang tệp văn bản hoặc tài liệu từ (DOCX) theo yêu cầu của bạn. Bạn có thể dễ dàng định cấu hình API bằng cách tải xuống tệp DLL từ phần Tải xuống hoặc qua Trình quản lý gói NuGet bằng lệnh sau:

PM> Install-Package Aspose.OCR

Chuyển đổi hình ảnh sang tài liệu Word với OCR Lập trình bằng C#

Đôi khi bạn nhận được hình ảnh được quét hoặc chụp của văn bản không thể tìm kiếm hoặc chỉnh sửa được. Nói cách khác, bạn có thể chuyển đổi hình ảnh thành tài liệu từ có thể chỉnh sửa và tìm kiếm được (DOCX) bằng OCR theo lập trình. Ngoài ra, bạn cần làm theo các bước bên dưới để thực hiện OCR trên hình ảnh và lưu kết quả dưới dạng tệp từ DOCX:

  1. Đầu tiên, khởi tạo một thể hiện của lớp AsposeOcr.
  2. Sau đó nhận dạng hình ảnh đầu vào.
  3. Cuối cùng, lưu kết quả ở định dạng Tài liệu Microsoft Word (DOCX).

Đoạn mã sau giải thích cách chuyển đổi hình ảnh sang tài liệu Word (DOCX) bằng OCR theo lập trình bằng C#:

// Khởi tạo một phiên bản của AsposeOcr
AsposeOcr api = new AsposeOcr();

// Nhận dạng hình ảnh đầu vào
RecognitionResult result = api.RecognizeImage("sample.png", new RecognitionSettings { });

// Lưu kết quả ở định dạng Tài liệu Microsoft Word
result.Save("sample.docx", SaveFormat.Docx);

Chuyển đổi hình ảnh sang tài liệu Word bằng cách sử dụng Kiểm tra chính tả với OCR trong C#

Bạn có thể nhận dạng văn bản bằng các ngôn ngữ khác nhau và chuyển đổi hình ảnh sang tài liệu từ. API hỗ trợ nhiều ngôn ngữ và cho phép bạn sử dụng từ điển để tối đa hóa hiệu quả và tính xác thực của đầu ra. Hơn nữa, sau đây là danh sách một số từ điển được sử dụng phổ biến được hỗ trợ để kiểm tra chính tả đối với văn bản được nhận dạng:

  • Tiếng Anh: từ điển tiếng Anh
  • Deu: từ điển tiếng Đức
  • Spa: Từ điển tiếng Tây Ban Nha
  • Fra: từ điển tiếng Pháp
  • Swe: từ điển tiếng Thụy Điển

Hơn nữa, bạn có thể tham khảo Tài liệu tham khảo API để tìm danh sách đầy đủ các từ điển được hỗ trợ cho đến nay.

Vui lòng làm theo các bước bên dưới để chuyển đổi hình ảnh thành tài liệu từ (DOCX) bằng cách sử dụng kiểm tra chính tả với OCR:

  1. Đầu tiên, khởi tạo một đối tượng của lớp AsposeOcr.
  2. Nhận dạng hình ảnh với OCR bằng phương pháp RecognizeImage().
  3. Cuối cùng, lưu kết quả ở định dạng Tài liệu Word với tính năng kiểm tra chính tả.

Đoạn mã dưới đây trình bày chi tiết cách chuyển đổi văn bản trong hình ảnh sang tài liệu từ (DOCX) theo cách lập trình bằng ngôn ngữ C#:

// Khởi tạo một phiên bản của AsposeOcr
AsposeOcr api = new AsposeOcr();

// Nhận dạng hình ảnh với OCR
RecognitionResult result = api.RecognizeImage("sample.png", new RecognitionSettings { });

// Lưu kết quả ở định dạng Tài liệu Word của bạn với tính năng kiểm tra chính tả
result.Save("Sample_SpellCheck.docx", SaveFormat.Docx, true, SpellChecker.SpellCheckLanguage.Eng);

Nhận giấy phép API miễn phí

Quan tâm đến việc kiểm tra API trong toàn bộ khả năng của nó mà không có giới hạn đánh giá? Bạn có thể yêu cầu một Giấy phép Tạm thời Miễn phí.

Sự kết luận

Tóm lại, bạn đã khám phá cách chuyển đổi văn bản từ hình ảnh sang tài liệu từ có thể chỉnh sửa hoặc tìm kiếm được với tính năng OCR theo cách lập trình bằng C#. Hơn nữa, bạn có thể xem qua Tài liệu API để khám phá các tính năng khác được cung cấp bởi API. Hơn nữa, vui lòng liên hệ với chúng tôi tại Diễn đàn hỗ trợ miễn phí nếu bạn có bất kỳ thắc mắc nào.

Xem thêm