Los archivos escaneados PDF contienen imágenes donde el texto no se puede seleccionar ni editar. En ciertas situaciones, es posible que deba convertir un PDF escaneado a un documento de Word. En este artículo, aprenderá cómo convertir un PDF escaneado a un documento de Word en formato DOCX o DOC mediante programación usando C#:
- Convertidor de PDF escaneado a Word DOCX: instalación de la API de C#
- Convierta un PDF escaneado a un documento de Word mediante programación usando C#
Convertidor de PDF escaneado a Word DOCX: instalación de la API de C#
Puede trabajar con archivos PDF escaneados realizando operaciones de OCR con Aspose.OCR for .NET API y luego crear un documento de Word usando Aspose.Words for .NET API mediante programación usando C#. Puede configurar las API descargando los archivos DLL de Nuevas versiones, o con los siguientes comandos de instalación de NuGet:
PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words
Convierta un PDF escaneado a un documento de Word mediante programación usando C#
Puede convertir archivos PDF escaneados a documentos de Word reconociendo el texto ópticamente. Las operaciones de OCR convierten el PDF escaneado en texto y luego el documento de Word se genera en formato DOC o DOCX. Siga los pasos a continuación para convertir un PDF escaneado a un documento de Word:
- Inicialice la instancia de clase AsposeOcr.
- Reconoce imágenes de PDF con la clase DocumentRecognitionSettings.
- Inicialice el objeto de clase StringBuilder y guarde el texto.
- Inicialice el documento de Word con la clase Document.
- Especifique el formato de fuente y párrafo.
- Guarde el documento de Word de salida como archivo DOCX o DOC.
El siguiente fragmento de código muestra cómo convertir un archivo PDF escaneado en un documento de Word mediante programación usando C#:
Obtenga una licencia de evaluación gratuita
Puede probar las API a pleno rendimiento solicitando una licencia temporal gratuita.
Conclusión
En este artículo, aprendió cómo convertir un archivo PDF escaneado a un documento de Word en formato DOCX o DOC mediante programación usando C#. Además, puede explorar otras funciones relacionadas con OCR visitando la documentación. No dude en ponerse en contacto con nosotros en el foro en caso de cualquier consulta.
Ver también
Sugerencia: si alguna vez necesita obtener un documento de Word de una presentación de PowerPoint, puede usar el convertidor Aspose Presentación a documento de Word.