圖像到 PDF OCR

圖像或掃描文檔可以包含文本信息。您可以使用 C# 以編程方式將掃描文檔或圖像轉換為具有 OCR 的可搜索 PDF 文檔。因此 JPGPNGTIFFBMP 和其他 圖像格式 可以轉換為可搜索的 PDF 文件。有關詳細信息,請參閱以下部分:

帶有 OCR 的圖像到可搜索的 PDF 轉換器 – C# API 安裝

Aspose.OCR for .NET API可以高效地對圖像或掃描文檔進行OCR操作。您可以通過從 New Releases 部分下載 DLL 文件或使用以下 NuGet 安裝命令來配置 API:

PM> Install-Package Aspose.OCR

使用 C# 以編程方式使用 OCR 將圖像轉換為可搜索的 PDF

您可以按照以下步驟將 JPG、PNG、TIFF 和其他圖像格式轉換為可使用 OCR 搜索的 PDF:

  1. 設置輸入圖像識別的路徑。
  2. 初始化 AsposeOcr 類實例。
  3. 使用 RecognizeImage 方法識別輸入圖像。
  4. 將輸出保存到可搜索的 PDF 文件。

下面的代碼顯示瞭如何使用 C# 將 JPG、PNG、TIFF 和其他圖像格式轉換為可搜索的帶有 OCR 的 PDF:

// 設置輸入圖片識別路徑
string image = "p24.jpg";

// 初始化 AsposeOcr 類實例
AsposeOcr api = new AsposeOcr();

// 使用 RecognizeImage 方法識別輸入圖像
RecognitionResult result = api.RecognizeImage(image, new RecognitionSettings());

// 將輸出保存到可搜索的 PDF 文件
result.Save("test.pdf", SaveFormat.Pdf);

在 C# 中以編程方式使用 OCR 將傾斜圖像轉換為可搜索的 PDF

圖像有時會因不同原因而傾斜。有時您可能知道圖像的傾斜角度並在識別圖像之前指定它,但是當您不知道傾斜角度時,您可以通過API計算傾斜角度。以下步驟展示瞭如何將傾斜的圖像轉換為可搜索的 PDF 文件:

  1. 指定輸入圖像的路徑。
  2. 初始化 AsposeOcr 類對象。
  3. 初始化 RecognitionSettings 類實例。
  4. 計算圖像的傾斜角度。
  5. 識別圖像並保存輸出可搜索的 PDF 文件。

以下代碼顯示瞭如何使用 C# 以編程方式將傾斜圖像轉換為可搜索的 PDF 文件:

// 設置輸入圖片識別路徑
string image = "p24.jpg";

// 初始化 AsposeOcr 類對象
AsposeOcr api = new AsposeOcr();

// 初始化 RecognitionSettings 類實例
RecognitionSettings settings = new RecognitionSettings();

// 計算圖像的傾斜角度
float angle = api.CalculateSkew(image);
settings.SkewAngle = angle;

// 使用 RecognizeImage 方法識別輸入圖像
RecognitionResult result = api.RecognizeImage(image, settings);

// 使用 OCR 將圖像保存為可搜索的 PDF 文件
result.Save("Test.pdf", SaveFormat.Pdf);

以下是輸入圖像和輸出 PDF 文件的屏幕截圖:

圖像到 PDF OCR

獲得免費評估許可證

您可以通過申請 免費臨時許可證 不受任何限制地評估 API。

結論

在本文中,您探索瞭如何使用 C# 以編程方式將圖像轉換為可搜索的 PDF 文件。 JPG、PNG、BMP、TIFF 以及掃描文檔都可以轉換為 PDF 文件。您可以通過訪問 文檔 部分探索 API 的其他功能,如有任何疑慮,請隨時通過 免費支持論壇 與我們聯繫。

也可以看看