掃描的 PDF 到 Excel OCR

掃描的 PDF 文件包含圖像格式的數據,有時您可能需要此類文檔中的信息。在某些情況下,掃描的 PDF 文件可能包含可能需要在 Excel 中處理的數字信息。據此,您可以執行 OCR 操作並創建 Excel 文件。本文介紹如何使用 C# 以編程方式創建具有 OCR 功能的掃描 PDF 到 Excel 轉換器。

使用 OCR 創建掃描的 PDF 到 Excel 轉換器 – C# API 安裝

您可以使用 Aspose.OCR for .NET API 提供的 OCR 功能。通過從 New Releases 部分下載 DLL 文件,或使用下面的 NuGet 安裝命令,您可以使用 OCR 輕鬆創建掃描的 PDF 到 Excel 轉換器:

PM> Install-Package Aspose.OCR

在 C# 中以編程方式將掃描的 PDF 轉換為 Excel

您可以按照以下步驟將掃描的 PDF 文檔轉換為帶有 OCR 的 Excel 文件:

  1. 實例化 AsposeOcr 類對象。
  2. 指定 DocumentRecognitionSettings 類對象。
  3. 使用 RecognizePdf 方法識別掃描的 PDF 文件。
  4. 使用 SaveMultipageDocument 方法保存輸出 Excel 文件。

以下代碼示例說明瞭如何使用 C# 將掃描的 PDF 轉換為 Excel:

// 掃描的PDF文件路徑
string path = "Scanned.pdf";

// 初始化 AsposeOcr 類對象
AsposeOcr api = new AsposeOcr();

// 指定識別 PDF 文件的設置
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;

// 從掃描的 PDF 文件中識別頁面
List<RecognitionResult> res = api.RecognizePdf(path , settings);

// 將輸出結果保存為XLSX格式的Excel文件
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);

獲得免費評估許可證

您可以通過申請 免費臨時許可證 來評估將掃描的 PDF 完全轉換為 Excel 的功能。

結論

在本文中,您了解瞭如何通過應用 OCR 操作以光學方式識別文本,將掃描的 PDF 文件轉換為 Excel。這在諸如掃描儀掃描 CSV 文件並生成 PDF 文件等場景中很有用。您可以使用 C# 以編程方式將其轉換為 Excel 文件。此外,您可以通過 文檔 查看 API 提供的其他 OCR 相關功能。如有任何疑問,請隨時通過論壇與我們聯繫。

也可以看看