識別文本 DjVu Image C# OCR

DjVu 格式用於存儲掃描文檔,因為它們可以包含文本、圖像或繪圖。 DjVu 用於存檔數據,因為它能夠使用最小空間存儲數據。本文介紹如何在 C# 中以編程方式使用 OCR 操作識別 DjVu 圖像中的文本。

DjVu 圖像文本識別——C# API 安裝

Aspose.OCR for .NET API 支持對 JPG、PNG、PDF 等不同類型文檔的光學字符識別。同樣,它還支持從多頁 DjVu 圖像文件中識別文本。您可以通過從 下載 部分下載 API 的 JAR 文件輕鬆配置 API。同樣,您可以運行以下 NuGet 安裝命令在您的項目中安裝該庫:

PM> Install-Package Aspose.OCR

在 C# 中對 DjVu 圖像執行 OCR 識別文本

您可以按照以下步驟對多頁 DjVu 圖像執行 OCR 操作來識別文本:

  1. 使用 AsposeOCR 類初始化 API 實例。
  2. 創建一個 DocumentRecognitionSettings 類對象。
  3. 使用 RecognizeDjvu 方法識別文本。
  4. 打印識別的文本。

以下代碼示例展示瞭如何通過在 C# 中以編程方式執行 OCR 來識別 DjVu 圖像中的文本:

// 輸入 DJVU 圖像文件路徑
string imgPath = "sample1.djvu";

// 初始化 AsposeOcr 類對象
AsposeOcr api = new AsposeOcr();

// 識別來自 DJVU 的圖像
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.PagesNumber = 0;
List<Aspose.OCR.RecognitionResult> result = api.RecognizeDjvu(imgPath, set);

// 打印結果
int pageNumber = 0;
foreach (var page in result)
{
    System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}

獲取免費的 API 許可證

您可以申請 免費臨時許可證 來評估 API,沒有任何評估限制。

結論

總之,您已經了解瞭如何在多頁 DjVu 圖像上使用 OCR 操作來識別文本。您可以通過指定文檔識別設置來識別文本,您可以在其中為輸入圖像設置自動對比度和傾斜選項,以提高文本識別過程的準確性。此外,您可以通過查看 文檔 部分來探索 API 支持的各種其他功能。如果您需要討論您的任何疑慮或要求,請隨時在 論壇 上寫信給我們。

也可以看看

在 C# 中使用 OCR 將圖像轉換為 Excel