Imagen a PDF OCR

Las imágenes o los documentos escaneados pueden contener información textual. Puede convertir un documento escaneado o una imagen en un documento PDF que permite realizar búsquedas con OCR mediante programación usando C#. Por lo tanto, JPG, PNG, TIFF, BMP y otros formatos de imagen se pueden convertir en archivos PDF con capacidad de búsqueda. Consulte las siguientes secciones para obtener más detalles:

Convertidor de imagen a PDF con opción de búsqueda con OCR: instalación de la API de C#

Aspose.OCR for .NET La API puede realizar operaciones de OCR de manera eficiente en imágenes o documentos escaneados. Puede configurar la API descargando el archivo DLL desde la sección Nuevos lanzamientos, o con el siguiente comando de instalación NuGet:

PM> Install-Package Aspose.OCR

Convierta la imagen a un PDF con capacidad de búsqueda con OCR programáticamente usando C#

Puede convertir un JPG, PNG, TIFF y otros formatos de imagen a un PDF con capacidad de búsqueda con OCR siguiendo los pasos a continuación:

  1. Establezca la ruta para que la imagen de entrada la reconozca.
  2. Inicialice la instancia de clase AsposeOcr.
  3. Reconocer la imagen de entrada con el método RecognizeImage.
  4. Guarde la salida en un archivo PDF con capacidad de búsqueda.

El siguiente código muestra cómo convertir JPG, PNG, TIFF y otros formatos de imagen a PDF con capacidad de búsqueda con OCR usando C#:

// Establecer ruta para que la imagen de entrada reconozca
string image = "p24.jpg";

// Inicializar instancia de clase AsposeOcr
AsposeOcr api = new AsposeOcr();

// Reconocer la imagen de entrada con el método RecognizeImage
RecognitionResult result = api.RecognizeImage(image, new RecognitionSettings());

// Guarde la salida en un archivo PDF con capacidad de búsqueda
result.Save("test.pdf", SaveFormat.Pdf);

Convierta una imagen sesgada en un PDF con capacidad de búsqueda con OCR programáticamente en C#

Las imágenes a veces pueden estar sesgadas por diferentes razones. A veces, puede conocer el ángulo de inclinación de las imágenes y especificarlo antes de reconocer la imagen; sin embargo, puede calcular el ángulo de inclinación con la API cuando no conoce el ángulo. Los siguientes pasos muestran cómo convertir una imagen sesgada en un archivo PDF con capacidad de búsqueda:

  1. Especifique la ruta para la imagen de entrada.
  2. Inicialice el objeto de clase AsposeOcr.
  3. Inicialice la instancia de clase RecognitionSettings.
  4. Calcular el ángulo de inclinación de la imagen.
  5. Reconocer la imagen y guardar el archivo PDF de búsqueda de salida.

El siguiente código muestra cómo convertir una imagen sesgada en un archivo PDF con capacidad de búsqueda mediante programación usando C#:

// Establecer ruta para que la imagen de entrada reconozca
string image = "p24.jpg";

// Inicializar objeto de clase AsposeOcr
AsposeOcr api = new AsposeOcr();

// Inicializar instancia de clase RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Calcular el ángulo de inclinación de la imagen
float angle = api.CalculateSkew(image);
settings.SkewAngle = angle;

// Reconocer la imagen de entrada con el método RecognizeImage
RecognitionResult result = api.RecognizeImage(image, settings);

// Guarde la imagen en un archivo PDF con capacidad de búsqueda con OCR
result.Save("Test.pdf", SaveFormat.Pdf);

A continuación se muestra una captura de pantalla de la imagen de entrada y el archivo PDF de salida:

Imagen a PDF OCR

Obtenga una licencia de evaluación gratuita

Puede evaluar la API sin limitaciones solicitando una Licencia Temporal Gratuita.

Conclusión

En este artículo, ha explorado cómo convertir una imagen en un archivo PDF con capacidad de búsqueda mediante programación usando C#. Un JPG, PNG, BMP, TIFF y un documento escaneado se pueden convertir a un archivo PDF. Puede explorar otras características de la API visitando la sección Documentación y no dude en contactarnos en el Foro de soporte gratuito para cualquier inquietud.

Ver también