使用 Java 執行 OCR

光學字符識別 (OCR) 技術使識別和讀取掃描文檔和圖像中的文本成為可能。 OCR 可讓您將只讀文本轉換為可編輯形式。轉換後的文本可以進一步處理以進行文本分析等操作。在本文中,我將向您展示如何對圖像(PNGJPGBMPGIF)執行 OCR 並將圖像轉換為文本使用 Java OCR API - Aspose.OCR for Java

提示:您可能對免費的 Text to GIF Converter 感興趣,它允許您從文本生成動畫。

Java OCR API - 安裝

Aspose.OCR for Java 可以下載為 JAR 或使用以下配置安裝在基於 Maven 的應用程序中。

存儲庫:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

依賴:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

使用 Java 將圖像轉換為文本

大多數情況下,OCR 的圖像是掃描文檔、發票、收據、賬單等的頁面,其中文本由多行組成。在這種情況下,您需要從圖像中檢索整個文本。以下是使用 Aspose.OCR for Java 對具有多行文本的圖像執行 OCR 的步驟。

以下代碼示例顯示瞭如何使用 Java 對圖像執行 OCR 並將圖像轉換為文本。

// 有關完整示例和數據文件,請訪問 https://github.com/aspose-ocr/Aspose.OCR-for-Java
// 文檔目錄的路徑。
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);

// 圖片路徑
String imagePath = dataDir + "p3.png";

//創建 api 實例
AsposeOCR api = new AsposeOCR();

// 通過文件的完整路徑識別頁面
try {
	String result = api.RecognizePage(imagePath);
	System.out.println("Result: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

轉換具有單行文本的圖像

在前面的示例中,我們對包含多行文本的圖像執行了 OCR。但是,可能存在圖像包含單行文本的情況。對於這種情況,您可以相應地配置 API。以下是轉換具有單行文本的圖像的步驟。

以下代碼示例顯示瞭如何使用 Java 對具有單行文本的圖像執行 OCR。

// 有關完整示例和數據文件,請訪問 https://github.com/aspose-ocr/Aspose.OCR-for-Java
// 文檔目錄的路徑。
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);

// 圖片路徑
String imagePath = dataDir + "0001460985.Jpeg";

//創建 api 實例
AsposeOCR api = new AsposeOCR();

try {
	String result = api.RecognizeLine(imagePath);
	System.out.println("File: " + imagePath);
	System.out.println("Result line: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

結論

在本文中,您了解瞭如何使用 Java OCR API 將 PNG、JPG、BMP 和 GIF 圖像轉換為文本。代碼示例展示瞭如何在 Java 應用程序中對具有單行或多行文本的圖像執行 OCR。您可以使用 文檔 了解有關 Aspose 的 Java OCR API 的更多信息。

也可以看看