PDF escaneado a Word OCR csharp

Los archivos escaneados PDF contienen imágenes donde el texto no se puede seleccionar ni editar. En ciertas situaciones, es posible que deba convertir un PDF escaneado a un documento de Word. En este artículo, aprenderá cómo convertir un PDF escaneado a un documento de Word en formato DOCX o DOC mediante programación usando C#:

Convertidor de PDF escaneado a Word DOCX: instalación de la API de C#

Puede trabajar con archivos PDF escaneados realizando operaciones de OCR con Aspose.OCR for .NET API y luego crear un documento de Word usando Aspose.Words for .NET API mediante programación usando C#. Puede configurar las API descargando los archivos DLL de Nuevas versiones, o con los siguientes comandos de instalación de NuGet:

PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words

Convierta un PDF escaneado a un documento de Word mediante programación usando C#

Puede convertir archivos PDF escaneados a documentos de Word reconociendo el texto ópticamente. Las operaciones de OCR convierten el PDF escaneado en texto y luego el documento de Word se genera en formato DOC o DOCX. Siga los pasos a continuación para convertir un PDF escaneado a un documento de Word:

  1. Inicialice la instancia de clase AsposeOcr.
  2. Reconoce imágenes de PDF con la clase DocumentRecognitionSettings.
  3. Inicialice el objeto de clase StringBuilder y guarde el texto.
  4. Inicialice el documento de Word con la clase Document.
  5. Especifique el formato de fuente y párrafo.
  6. Guarde el documento de Word de salida como archivo DOCX o DOC.

El siguiente fragmento de código muestra cómo convertir un archivo PDF escaneado en un documento de Word mediante programación usando C#:

Obtenga una licencia de evaluación gratuita

Puede probar las API a pleno rendimiento solicitando una licencia temporal gratuita.

Conclusión

En este artículo, aprendió cómo convertir un archivo PDF escaneado a un documento de Word en formato DOCX o DOC mediante programación usando C#. Además, puede explorar otras funciones relacionadas con OCR visitando la documentación. No dude en ponerse en contacto con nosotros en el foro en caso de cualquier consulta.

Ver también

Sugerencia: si alguna vez necesita obtener un documento de Word de una presentación de PowerPoint, puede usar el convertidor Aspose Presentación a documento de Word.