圖像或掃描文檔可以包含文本信息。您可以使用 C# 以編程方式將掃描文檔或圖像轉換為具有 OCR 的可搜索 PDF 文檔。因此 JPG、PNG、TIFF、BMP 和其他 圖像格式 可以轉換為可搜索的 PDF 文件。有關詳細信息,請參閱以下部分:
- 帶有 OCR 的圖像到可搜索的 PDF 轉換器 – C# API 安裝
- 使用 C# 以編程方式使用 OCR 將圖像轉換為可搜索的 PDF
- 在 C# 中以編程方式使用 OCR 將傾斜圖像轉換為可搜索的 PDF
帶有 OCR 的圖像到可搜索的 PDF 轉換器 – C# API 安裝
Aspose.OCR for .NET API可以高效地對圖像或掃描文檔進行OCR操作。您可以通過從 New Releases 部分下載 DLL 文件或使用以下 NuGet 安裝命令來配置 API:
PM> Install-Package Aspose.OCR
使用 C# 以編程方式使用 OCR 將圖像轉換為可搜索的 PDF
您可以按照以下步驟將 JPG、PNG、TIFF 和其他圖像格式轉換為可使用 OCR 搜索的 PDF:
- 設置輸入圖像識別的路徑。
- 初始化 AsposeOcr 類實例。
- 使用 RecognizeImage 方法識別輸入圖像。
- 將輸出保存到可搜索的 PDF 文件。
下面的代碼顯示瞭如何使用 C# 將 JPG、PNG、TIFF 和其他圖像格式轉換為可搜索的帶有 OCR 的 PDF:
// 設置輸入圖片識別路徑
string image = "p24.jpg";
// 初始化 AsposeOcr 類實例
AsposeOcr api = new AsposeOcr();
// 使用 RecognizeImage 方法識別輸入圖像
RecognitionResult result = api.RecognizeImage(image, new RecognitionSettings());
// 將輸出保存到可搜索的 PDF 文件
result.Save("test.pdf", SaveFormat.Pdf);
在 C# 中以編程方式使用 OCR 將傾斜圖像轉換為可搜索的 PDF
圖像有時會因不同原因而傾斜。有時您可能知道圖像的傾斜角度並在識別圖像之前指定它,但是當您不知道傾斜角度時,您可以通過API計算傾斜角度。以下步驟展示瞭如何將傾斜的圖像轉換為可搜索的 PDF 文件:
- 指定輸入圖像的路徑。
- 初始化 AsposeOcr 類對象。
- 初始化 RecognitionSettings 類實例。
- 計算圖像的傾斜角度。
- 識別圖像並保存輸出可搜索的 PDF 文件。
以下代碼顯示瞭如何使用 C# 以編程方式將傾斜圖像轉換為可搜索的 PDF 文件:
// 設置輸入圖片識別路徑
string image = "p24.jpg";
// 初始化 AsposeOcr 類對象
AsposeOcr api = new AsposeOcr();
// 初始化 RecognitionSettings 類實例
RecognitionSettings settings = new RecognitionSettings();
// 計算圖像的傾斜角度
float angle = api.CalculateSkew(image);
settings.SkewAngle = angle;
// 使用 RecognizeImage 方法識別輸入圖像
RecognitionResult result = api.RecognizeImage(image, settings);
// 使用 OCR 將圖像保存為可搜索的 PDF 文件
result.Save("Test.pdf", SaveFormat.Pdf);
以下是輸入圖像和輸出 PDF 文件的屏幕截圖:
獲得免費評估許可證
您可以通過申請 免費臨時許可證 不受任何限制地評估 API。
結論
在本文中,您探索瞭如何使用 C# 以編程方式將圖像轉換為可搜索的 PDF 文件。 JPG、PNG、BMP、TIFF 以及掃描文檔都可以轉換為 PDF 文件。您可以通過訪問 文檔 部分探索 API 的其他功能,如有任何疑慮,請隨時通過 免費支持論壇 與我們聯繫。