Изображение в PDF OCR

Изображения или отсканированные документы могут содержать текстовую информацию. Вы можете преобразовать отсканированный документ или изображение в доступный для поиска документ PDF с OCR программно с помощью C#. Таким образом, JPG, PNG, TIFF, BMP и другие форматы изображений можно преобразовать в файлы PDF с возможностью поиска. Дополнительные сведения см. в следующих разделах:

Конвертер изображений в PDF с возможностью поиска с OCR — установка C# API

Aspose.OCR for .NET API может эффективно выполнять операции OCR на изображениях или отсканированных документах. Вы можете настроить API, загрузив файл DLL из раздела Новые версии или с помощью следующей команды установки NuGet:

PM> Install-Package Aspose.OCR

Преобразование изображения в PDF с возможностью поиска с помощью OCR Программно с использованием C#

Вы можете преобразовать JPG, PNG, TIFF и другие форматы изображений в PDF с возможностью поиска с помощью OCR, выполнив следующие действия:

  1. Установите путь для входного изображения для распознавания.
  2. Инициализировать экземпляр класса AsposeOcr.
  3. Распознайте входное изображение методом RecognizeImage.
  4. Сохраните вывод в файл PDF с возможностью поиска.

В приведенном ниже коде показано, как преобразовать JPG, PNG, TIFF и другие форматы изображений в PDF с возможностью поиска с помощью OCR с помощью C#:

// Установите путь для входного изображения для распознавания
string image = "p24.jpg";

// Инициализировать экземпляр класса AsposeOcr
AsposeOcr api = new AsposeOcr();

// Распознайте входное изображение с помощью метода RecognizeImage
RecognitionResult result = api.RecognizeImage(image, new RecognitionSettings());

// Сохранить вывод в файл PDF с возможностью поиска
result.Save("test.pdf", SaveFormat.Pdf);

Программное преобразование перекошенного изображения в PDF с возможностью поиска с помощью OCR на C#

Иногда изображения могут быть перекошены по разным причинам. Иногда вы можете знать угол наклона изображений и указать его перед распознаванием изображения, однако вы можете рассчитать угол наклона с помощью API, если угол вам не известен. Следующие шаги показывают, как преобразовать перекошенное изображение в PDF-файл с возможностью поиска:

  1. Укажите путь для входного изображения.
  2. Инициализировать объект класса AsposeOcr.
  3. Инициализировать экземпляр класса RecognitionSettings.
  4. Вычислите угол наклона изображения.
  5. Распознайте изображение и сохраните выходной PDF-файл с возможностью поиска.

В следующем коде показано, как преобразовать искаженное изображение в файл PDF с возможностью поиска программным путем с помощью C#:

// Установите путь для входного изображения для распознавания
string image = "p24.jpg";

// Инициализировать объект класса AsposeOcr
AsposeOcr api = new AsposeOcr();

// Инициализировать экземпляр класса RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Вычислить угол наклона изображения
float angle = api.CalculateSkew(image);
settings.SkewAngle = angle;

// Распознайте входное изображение с помощью метода RecognizeImage
RecognitionResult result = api.RecognizeImage(image, settings);

// Сохранение изображения в PDF-файл с возможностью поиска с помощью OCR
result.Save("Test.pdf", SaveFormat.Pdf);

Ниже приведен скриншот входного изображения и выходного PDF-файла:

Изображение в PDF OCR

Получите бесплатную ознакомительную лицензию

Вы можете оценить API без каких-либо ограничений, запросив Бесплатную временную лицензию.

Вывод

В этой статье вы узнали, как преобразовать изображение в PDF-файл с возможностью поиска программным путем с помощью C#. JPG, PNG, BMP, TIFF, а также отсканированный документ можно преобразовать в файл PDF. Вы можете ознакомиться с другими функциями API, посетив раздел Документация и не стесняясь обращаться к нам на Форум бесплатной поддержки по любым вопросам.

Смотрите также