图像转 PDF OCR

图像或扫描的文档可以包含文本信息。您可以使用 C# 以编程方式使用 OCR 将扫描的文档或图像转换为可搜索的 PDF 文档。因此 JPGPNGTIFFBMP 和其他 图像格式 可以转换为可搜索的 PDF 文件。有关详细信息,请参阅以下部分:

带有 OCR 的图像到可搜索 PDF 转换器 – C# API 安装

Aspose.OCR for .NET API 可以高效地对图像或扫描文档执行 OCR 操作。您可以通过从 New Releases 部分下载 DLL 文件或使用以下 NuGet 安装命令来配置 API:

PM> Install-Package Aspose.OCR

使用 C# 以编程方式使用 OCR 将图像转换为可搜索的 PDF

您可以按照以下步骤将 JPG、PNG、TIFF 和其他图像格式转换为可使用 OCR 搜索的 PDF:

  1. 设置要识别的输入图像的路径。
  2. 初始化 AsposeOcr 类实例。
  3. 使用 RecognizeImage 方法识别输入图像。
  4. 将输出保存到可搜索的 PDF 文件。

下面的代码展示了如何使用 C# 将 JPG、PNG、TIFF 和其他图像格式转换为使用 OCR 的可搜索 PDF:

// 设置输入图像的路径以识别
string image = "p24.jpg";

// 初始化 AsposeOcr 类实例
AsposeOcr api = new AsposeOcr();

// 使用 RecognizeImage 方法识别输入图像
RecognitionResult result = api.RecognizeImage(image, new RecognitionSettings());

// 将输出保存到可搜索的 PDF 文件
result.Save("test.pdf", SaveFormat.Pdf);

在 C# 中以编程方式使用 OCR 将倾斜的图像转换为可搜索的 PDF

图像有时会因不同的原因而歪斜。有时您可能知道图像的倾斜角度并在识别图像之前指定它,但是当您不知道角度时,您可以使用 API 计算倾斜角度。以下步骤显示了如何将倾斜的图像转换为可搜索的 PDF 文件:

  1. 指定输入图像的路径。
  2. 初始化 AsposeOcr 类对象。
  3. 初始化 RecognitionSettings 类实例。
  4. 计算图像的倾斜角度。
  5. 识别图像并保存输出可搜索的 PDF 文件。

以下代码显示了如何使用 C# 以编程方式将倾斜的图像转换为可搜索的 PDF 文件:

// 设置输入图像的路径以识别
string image = "p24.jpg";

// 初始化 AsposeOcr 类对象
AsposeOcr api = new AsposeOcr();

// 初始化 RecognitionSettings 类实例
RecognitionSettings settings = new RecognitionSettings();

// 计算图像的倾斜角度
float angle = api.CalculateSkew(image);
settings.SkewAngle = angle;

// 使用 RecognizeImage 方法识别输入图像
RecognitionResult result = api.RecognizeImage(image, settings);

// 使用 OCR 将图像保存到可搜索的 PDF 文件
result.Save("Test.pdf", SaveFormat.Pdf);

以下是输入图像和输出 PDF 文件的屏幕截图:

图像转 PDF OCR

获得免费评估许可证

您可以通过请求 免费临时许可证 来不受任何限制地评估 API。

结论

在本文中,您探索了如何使用 C# 以编程方式将图像转换为可搜索的 PDF 文件。 JPG、PNG、BMP、TIFF 以及扫描的文档都可以转换为 PDF 文件。您可以通过访问 文档 部分探索 API 的其他功能,如有任何问题,请随时通过 免费支持论坛 与我们联系。

也可以看看