將圖像轉換為 DOCX-OCR-java

您可以將圖像轉換為 DOCXDOC 文件格式的可搜索或可編輯的 word 文檔。流行的圖片格式如JPGPNGTIFFBMP等,都可以轉換成帶OCR的word文檔(DOC/DOCX)爪哇。請參閱以下主題以了解更多信息:

圖像到 Word 文檔轉換器 – Java API 安裝

Aspose.OCR for Java可用於高效的圖像光學字符識別。您可以使用 Java 以編程方式將掃描圖像轉換為可搜索的 DOCX 文件。請從 New Releases 下載 JAR 文件或在基於 Maven 的項目的 pom.xml 文件中配置它,如下所述:

存儲庫:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

依賴:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

使用 Java 將圖像轉換為可搜索的 Word 文檔 (DOC/DOCX)

您可以通過以下步驟將圖像轉換為可搜索的 word 文檔:

  1. 聲明 AsposeOcr 類的一個實例。
  2. 實例化 RecognitionSettings 類對象。
  3. 使用 RecognizePage 方法識別輸入圖像。
  4. 最後,將輸出保存為 Microsoft Word 文檔 (DOC/DOCX) 格式。

以下代碼顯示瞭如何使用 Java 將圖像轉換為 word 文檔 (DOC/DOCX):

// 初始化 AsposeOcr 實例
AsposeOCR api = new AsposeOCR();

// 實例化 RecognitionSettings 類對象
RecognitionSettings settings = new RecognitionSettings();

// 使用 RecognizePage 方法識別輸入圖像
RecognitionResult result = api.RecognizePage("sample.png", settings);

// 以 Microsoft Word 文檔格式保存結果
result.save("sample.docx", Format.Docx);

使用 Java 中的拼寫檢查將圖像轉換為可搜索的 Word 文檔 (DOC/DOCX)

您可以通過以下步驟將圖像轉換為 word 文檔 (DOCX/DOC):

  1. 首先,指定 AsposeOcr 類的一個實例。
  2. 聲明 RecognitionSettings 類對象。
  3. 使用 RecognizePage 方法通過 OCR 識別圖像。
  4. 使用拼寫檢查將結果保存為 Word 文檔 (DOC/DOCX) 格式。

下面的代碼解釋瞭如何在 Java 中使用拼寫檢查將圖像轉換為可搜索的 word 文檔:

// 初始化 AsposeOcr 實例
AsposeOCR api = new AsposeOCR();

// 實例化 RecognitionSettings 類對象
RecognitionSettings settings = new RecognitionSettings();

// 使用 RecognizePage 方法通過 OCR 識別圖像
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// 使用拼寫檢查將結果保存為 Word 文檔 (DOC/DOCX) 格式
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

獲取免費的 API 許可證

您可以使用 免費臨時許可證 全面測試 API。

結論

在本文中,您學習瞭如何將圖像轉換為 word 文檔 (DOC/DOCX)。此外,您可以通過使用相應詞典進行拼寫檢查來提高準確性。請通過 API 文檔 了解更多信息。此外,請隨時通過 免費支持論壇 與我們聯繫。

也可以看看