DjVu 格式用於存儲掃描文檔,因為它們可以包含文本、圖像或繪圖。 DjVu 用於存檔數據,因為它能夠使用最小空間存儲數據。本文介紹如何在 C# 中以編程方式使用 OCR 操作識別 DjVu 圖像中的文本。
DjVu 圖像文本識別——C# API 安裝
Aspose.OCR for .NET API 支持對 JPG、PNG、PDF 等不同類型文檔的光學字符識別。同樣,它還支持從多頁 DjVu 圖像文件中識別文本。您可以通過從 下載 部分下載 API 的 JAR 文件輕鬆配置 API。同樣,您可以運行以下 NuGet 安裝命令在您的項目中安裝該庫:
PM> Install-Package Aspose.OCR
在 C# 中對 DjVu 圖像執行 OCR 識別文本
您可以按照以下步驟對多頁 DjVu 圖像執行 OCR 操作來識別文本:
- 使用 AsposeOCR 類初始化 API 實例。
- 創建一個 DocumentRecognitionSettings 類對象。
- 使用 RecognizeDjvu 方法識別文本。
- 打印識別的文本。
以下代碼示例展示瞭如何通過在 C# 中以編程方式執行 OCR 來識別 DjVu 圖像中的文本:
// 輸入 DJVU 圖像文件路徑
string imgPath = "sample1.djvu";
// 初始化 AsposeOcr 類對象
AsposeOcr api = new AsposeOcr();
// 識別來自 DJVU 的圖像
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.PagesNumber = 0;
List<Aspose.OCR.RecognitionResult> result = api.RecognizeDjvu(imgPath, set);
// 打印結果
int pageNumber = 0;
foreach (var page in result)
{
System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}
獲取免費的 API 許可證
您可以申請 免費臨時許可證 來評估 API,沒有任何評估限制。
結論
總之,您已經了解瞭如何在多頁 DjVu 圖像上使用 OCR 操作來識別文本。您可以通過指定文檔識別設置來識別文本,您可以在其中為輸入圖像設置自動對比度和傾斜選項,以提高文本識別過程的準確性。此外,您可以通過查看 文檔 部分來探索 API 支持的各種其他功能。如果您需要討論您的任何疑慮或要求,請隨時在 論壇 上寫信給我們。