convert-Image-to-DOCX-OCR-java

Bạn có thể chuyển đổi hình ảnh sang tài liệu word có thể tìm kiếm hoặc chỉnh sửa được ở định dạng tệp DOCX cũng như DOC. Các định dạng hình ảnh phổ biến như JPG, PNG, TIFF, BMP, v.v., có thể được chuyển đổi thành tài liệu từ (DOC / DOCX) với OCR trong Java. Hãy tham khảo các chủ đề sau để tìm hiểu thêm:

Chuyển đổi tài liệu hình ảnh sang Word - Cài đặt Java API

Aspose.OCR cho Java có thể được sử dụng để nhận dạng ký tự quang học hiệu quả của hình ảnh. Bạn có thể chuyển đổi hình ảnh đã quét thành tệp DOCX có thể tìm kiếm theo chương trình bằng Java. Vui lòng tải xuống tệp JAR từ Bản phát hành mới hoặc định cấu hình nó trong tệp pom.xml của dự án dựa trên Maven của bạn như được giải thích dưới đây:

Kho:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Sự phụ thuộc:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Chuyển đổi hình ảnh thành tài liệu Word có thể tìm kiếm (DOC / DOCX) bằng Java

Bạn có thể chuyển đổi hình ảnh thành tài liệu từ có thể tìm kiếm bằng các bước dưới đây:

  1. Khai báo một thể hiện của lớp AsposeOcr.
  2. Khởi tạo đối tượng lớp RecognitionSettings.
  3. Nhận dạng hình ảnh đầu vào với phương thức RecognizePage.
  4. Cuối cùng, lưu đầu ra ở định dạng Tài liệu Microsoft Word (DOC / DOCX).

Đoạn mã sau đây cho thấy cách chuyển đổi hình ảnh sang tài liệu từ (DOC / DOCX) bằng Java:

// Khởi tạo một phiên bản của AsposeOcr
AsposeOCR api = new AsposeOCR();

// Khởi tạo đối tượng lớp RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Nhận dạng hình ảnh đầu vào với phương thức RecognizePage
RecognitionResult result = api.RecognizePage("sample.png", settings);

// Lưu kết quả ở định dạng Tài liệu Microsoft Word
result.save("sample.docx", Format.Docx);

Chuyển đổi hình ảnh thành tài liệu từ có thể tìm kiếm (DOC / DOCX) với tính năng Kiểm tra chính tả trong Java

Bạn có thể chuyển đổi hình ảnh sang tài liệu từ (DOCX / DOC) bằng các bước sau:

  1. Đầu tiên, chỉ định một thể hiện của lớp AsposeOcr.
  2. Khai báo đối tượng lớp RecognitionSettings.
  3. Nhận dạng hình ảnh với OCR bằng phương pháp RecognizePage.
  4. Lưu kết quả ở định dạng Tài liệu Word (DOC / DOCX) với tính năng kiểm tra chính tả.

Đoạn mã dưới đây giải thích cách chuyển đổi hình ảnh thành tài liệu từ có thể tìm kiếm bằng tính năng kiểm tra chính tả trong Java:

// Khởi tạo một phiên bản của AsposeOcr
AsposeOCR api = new AsposeOCR();

// Đối tượng lớp Instantiate RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Nhận dạng hình ảnh với OCR bằng phương pháp RecognizePage
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// Lưu kết quả ở định dạng Tài liệu Word (DOC / DOCX) với tính năng kiểm tra chính tả
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

Nhận giấy phép API miễn phí

Bạn có thể kiểm tra API hết công suất của nó với Giấy phép Tạm thời Miễn phí.

Sự kết luận

Trong bài viết này, bạn đã học cách chuyển đổi hình ảnh sang tài liệu từ (DOC / DOCX). Hơn nữa, bạn có thể nâng cao độ chính xác bằng cách kiểm tra chính tả với từ điển tương ứng. Vui lòng xem qua tài liệu API để biết thêm thông tin. Hơn nữa, vui lòng liên hệ với chúng tôi tại Diễn đàn hỗ trợ miễn phí.

Xem thêm