您可以將圖像轉換為 DOCX 和 DOC 文件格式的可搜索或可編輯的 word 文檔。流行的圖片格式如JPG、PNG、TIFF、BMP等,都可以轉換成帶OCR的word文檔(DOC/DOCX)爪哇。請參閱以下主題以了解更多信息:
- 圖像到 Word 文檔轉換器 – Java API 安裝
- 使用 Java 將圖像轉換為可搜索的 Word 文檔 (DOC/DOCX)
- 使用 Java 中的拼寫檢查將圖像轉換為可搜索的 Word 文檔 (DOC/DOCX)
圖像到 Word 文檔轉換器 – Java API 安裝
Aspose.OCR for Java可用於高效的圖像光學字符識別。您可以使用 Java 以編程方式將掃描圖像轉換為可搜索的 DOCX 文件。請從 New Releases 下載 JAR 文件或在基於 Maven 的項目的 pom.xml 文件中配置它,如下所述:
存儲庫:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
依賴:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>20.5</version>
</dependency>
使用 Java 將圖像轉換為可搜索的 Word 文檔 (DOC/DOCX)
您可以通過以下步驟將圖像轉換為可搜索的 word 文檔:
- 聲明 AsposeOcr 類的一個實例。
- 實例化 RecognitionSettings 類對象。
- 使用 RecognizePage 方法識別輸入圖像。
- 最後,將輸出保存為 Microsoft Word 文檔 (DOC/DOCX) 格式。
以下代碼顯示瞭如何使用 Java 將圖像轉換為 word 文檔 (DOC/DOCX):
// 初始化 AsposeOcr 實例
AsposeOCR api = new AsposeOCR();
// 實例化 RecognitionSettings 類對象
RecognitionSettings settings = new RecognitionSettings();
// 使用 RecognizePage 方法識別輸入圖像
RecognitionResult result = api.RecognizePage("sample.png", settings);
// 以 Microsoft Word 文檔格式保存結果
result.save("sample.docx", Format.Docx);
使用 Java 中的拼寫檢查將圖像轉換為可搜索的 Word 文檔 (DOC/DOCX)
您可以通過以下步驟將圖像轉換為 word 文檔 (DOCX/DOC):
- 首先,指定 AsposeOcr 類的一個實例。
- 聲明 RecognitionSettings 類對象。
- 使用 RecognizePage 方法通過 OCR 識別圖像。
- 使用拼寫檢查將結果保存為 Word 文檔 (DOC/DOCX) 格式。
下面的代碼解釋瞭如何在 Java 中使用拼寫檢查將圖像轉換為可搜索的 word 文檔:
// 初始化 AsposeOcr 實例
AsposeOCR api = new AsposeOCR();
// 實例化 RecognitionSettings 類對象
RecognitionSettings settings = new RecognitionSettings();
// 使用 RecognizePage 方法通過 OCR 識別圖像
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);
// 使用拼寫檢查將結果保存為 Word 文檔 (DOC/DOCX) 格式
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);
獲取免費的 API 許可證
您可以使用 免費臨時許可證 全面測試 API。
結論
在本文中,您學習瞭如何將圖像轉換為 word 文檔 (DOC/DOCX)。此外,您可以通過使用相應詞典進行拼寫檢查來提高準確性。請通過 API 文檔 了解更多信息。此外,請隨時通過 免費支持論壇 與我們聯繫。