Изображения или отсканированные документы могут содержать текстовую информацию. Вы можете преобразовать отсканированный документ или изображение в доступный для поиска документ PDF с OCR программно с помощью C#. Таким образом, JPG, PNG, TIFF, BMP и другие форматы изображений можно преобразовать в файлы PDF с возможностью поиска. Дополнительные сведения см. в следующих разделах:
- Конвертер изображений в PDF с возможностью поиска с OCR — установка C# API
- Преобразование изображения в PDF с возможностью поиска с помощью OCR Программно с использованием C#
- Программное преобразование перекошенного изображения в PDF с возможностью поиска с помощью OCR на C#
Конвертер изображений в PDF с возможностью поиска с OCR — установка C# API
Aspose.OCR for .NET API может эффективно выполнять операции OCR на изображениях или отсканированных документах. Вы можете настроить API, загрузив файл DLL из раздела Новые версии или с помощью следующей команды установки NuGet:
PM> Install-Package Aspose.OCR
Преобразование изображения в PDF с возможностью поиска с помощью OCR Программно с использованием C#
Вы можете преобразовать JPG, PNG, TIFF и другие форматы изображений в PDF с возможностью поиска с помощью OCR, выполнив следующие действия:
- Установите путь для входного изображения для распознавания.
- Инициализировать экземпляр класса AsposeOcr.
- Распознайте входное изображение методом RecognizeImage.
- Сохраните вывод в файл PDF с возможностью поиска.
В приведенном ниже коде показано, как преобразовать JPG, PNG, TIFF и другие форматы изображений в PDF с возможностью поиска с помощью OCR с помощью C#:
// Установите путь для входного изображения для распознавания
string image = "p24.jpg";
// Инициализировать экземпляр класса AsposeOcr
AsposeOcr api = new AsposeOcr();
// Распознайте входное изображение с помощью метода RecognizeImage
RecognitionResult result = api.RecognizeImage(image, new RecognitionSettings());
// Сохранить вывод в файл PDF с возможностью поиска
result.Save("test.pdf", SaveFormat.Pdf);
Программное преобразование перекошенного изображения в PDF с возможностью поиска с помощью OCR на C#
Иногда изображения могут быть перекошены по разным причинам. Иногда вы можете знать угол наклона изображений и указать его перед распознаванием изображения, однако вы можете рассчитать угол наклона с помощью API, если угол вам не известен. Следующие шаги показывают, как преобразовать перекошенное изображение в PDF-файл с возможностью поиска:
- Укажите путь для входного изображения.
- Инициализировать объект класса AsposeOcr.
- Инициализировать экземпляр класса RecognitionSettings.
- Вычислите угол наклона изображения.
- Распознайте изображение и сохраните выходной PDF-файл с возможностью поиска.
В следующем коде показано, как преобразовать искаженное изображение в файл PDF с возможностью поиска программным путем с помощью C#:
// Установите путь для входного изображения для распознавания
string image = "p24.jpg";
// Инициализировать объект класса AsposeOcr
AsposeOcr api = new AsposeOcr();
// Инициализировать экземпляр класса RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();
// Вычислить угол наклона изображения
float angle = api.CalculateSkew(image);
settings.SkewAngle = angle;
// Распознайте входное изображение с помощью метода RecognizeImage
RecognitionResult result = api.RecognizeImage(image, settings);
// Сохранение изображения в PDF-файл с возможностью поиска с помощью OCR
result.Save("Test.pdf", SaveFormat.Pdf);
Ниже приведен скриншот входного изображения и выходного PDF-файла:
Получите бесплатную ознакомительную лицензию
Вы можете оценить API без каких-либо ограничений, запросив Бесплатную временную лицензию.
Вывод
В этой статье вы узнали, как преобразовать изображение в PDF-файл с возможностью поиска программным путем с помощью C#. JPG, PNG, BMP, TIFF, а также отсканированный документ можно преобразовать в файл PDF. Вы можете ознакомиться с другими функциями API, посетив раздел Документация и не стесняясь обращаться к нам на Форум бесплатной поддержки по любым вопросам.