PDF escaneado a Excel OCR

Los archivos escaneados PDF contienen datos en formato de imagen y, en ocasiones, es posible que necesite información de dichos documentos. En ciertas situaciones, un archivo PDF escaneado puede contener información numérica que puede necesitar ser manipulada en Excel. De acuerdo con eso, puede realizar operaciones de OCR y crear un archivo de Excel. Este artículo cubre cómo crear un convertidor de PDF escaneado a Excel con la función OCR mediante programación usando C#.

Cree un convertidor de PDF escaneado a Excel con OCR: instalación de la API de C#

Puede trabajar con las funciones de OCR que ofrece la API Aspose.OCR for .NET. Puede crear fácilmente un convertidor escaneado de PDF a Excel con OCR descargando el archivo DLL de la sección Nuevos lanzamientos, o con el comando de instalación NuGet a continuación:

PM> Install-Package Aspose.OCR

Convierta PDF escaneado a Excel mediante programación en C#

Puede convertir un documento PDF escaneado en un archivo de Excel con OCR siguiendo los pasos a continuación:

  1. Crear una instancia del objeto de clase AsposeOcr.
  2. Especifique un objeto de clase DocumentRecognitionSettings.
  3. Reconozca el archivo PDF escaneado con el método RecognizePdf.
  4. Guarde el archivo de salida de Excel usando el método SaveMultipageDocument.

El siguiente ejemplo de código explica cómo convertir un PDF escaneado a Excel usando C#:

// Ruta del archivo PDF escaneado
string path = "Scanned.pdf";

// Inicializar objeto AsposeOcr calss
AsposeOcr api = new AsposeOcr();

// Especifique la configuración para reconocer el archivo PDF
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;

// Reconocer páginas del archivo PDF escaneado
List<RecognitionResult> res = api.RecognizePdf(path , settings);

// Guarde el resultado de salida como un archivo de Excel en formato XLSX
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);

Obtenga una licencia de evaluación gratuita

Puede evaluar la función de convertir PDF escaneado a Excel en toda su capacidad solicitando una licencia temporal gratuita.

Conclusión

En este artículo, ha comprobado cómo convertir un archivo PDF escaneado a Excel aplicando operaciones de OCR para reconocer el texto ópticamente. Esto puede ser útil en escenarios como cuando un escáner escanea un archivo CSV y se produce un archivo PDF. Puede convertirlo en un archivo de Excel mediante programación usando C#. Además, puede echar un vistazo a otras funciones relacionadas con OCR que ofrece la API consultando la documentación. Si tiene alguna consulta, no dude en ponerse en contacto con nosotros en el foro.

Ver también