Convertir imagen a Word DOCX OCR

Puede convertir una imagen que contenga texto en un documento de Word editable (DOCX) mediante programación usando C#. Por ejemplo, necesita convertir una imagen capturada desde un escáner o una cámara en un documento editable y luego debe realizar OCR en la imagen de entrada. Puede consultar más detalles en las siguientes secciones:

Convertidor de imagen a documento de Word (DOCX) en C# - Instalación

Aspose.OCR for .NET La API se puede utilizar para reconocer texto de imágenes. Admite la conversión de imágenes a archivos de texto o documentos de Word (DOCX) según sus requisitos. Puede configurar fácilmente la API descargando el archivo DLL desde la sección Descargas o mediante NuGet Package Manager con el siguiente comando:

PM> Install-Package Aspose.OCR

Convierta una imagen a un documento de Word con OCR programáticamente usando C#

A veces obtiene imágenes escaneadas o capturadas de texto que no se pueden buscar ni editar. En otras palabras, puede convertir una imagen en un documento de Word editable y con capacidad de búsqueda (DOCX) con OCR mediante programación. Además, debe seguir los pasos a continuación para realizar un OCR en la imagen y guardar el resultado como un archivo de Word DOCX:

  1. En primer lugar, inicialice una instancia de la clase AsposeOcr.
  2. Luego reconozca la imagen de entrada.
  3. Finalmente, guarde el resultado en formato de documento de Microsoft Word (DOCX).

El siguiente código explica cómo convertir una imagen a un documento de Word (DOCX) con OCR programáticamente usando C#:

// Inicializar una instancia de AsposeOcr
AsposeOcr api = new AsposeOcr();

// Reconocer imagen de entrada
RecognitionResult result = api.RecognizeImage("sample.png", new RecognitionSettings { });

// Guarde el resultado en formato de documento de Microsoft Word
result.Save("sample.docx", SaveFormat.Docx);

Convierta una imagen en un documento de Word usando el corrector ortográfico con OCR en C#

Puede reconocer texto en diferentes idiomas y convertir la imagen en un documento de Word. La API admite varios idiomas y le permite utilizar los diccionarios para maximizar la eficiencia y la autenticidad de la salida. Además, la siguiente es una lista de algunos diccionarios de uso popular que son compatibles con la revisión ortográfica de texto reconocido:

  • Esp: diccionario de inglés
  • Deu: diccionario alemán
  • Spa: diccionario español
  • Fra: diccionario francés
  • Swe: diccionario sueco

Además, puede consultar las Referencias de la API para encontrar la lista completa de diccionarios admitidos hasta el momento.

Siga los pasos a continuación para convertir la imagen en un documento de Word (DOCX) usando la revisión ortográfica con OCR:

  1. En primer lugar, crea una instancia de un objeto de la clase AsposeOcr.
  2. Reconocer imagen con OCR utilizando el método RecognizeImage().
  3. Finalmente, guarde el resultado en formato de documento de Word con corrector ortográfico.

El siguiente código explica cómo convertir el texto de una imagen en un documento de Word (DOCX) mediante programación utilizando el lenguaje C#:

// Inicializar una instancia de AsposeOcr
AsposeOcr api = new AsposeOcr();

// Reconocer imagen con OCR
RecognitionResult result = api.RecognizeImage("sample.png", new RecognitionSettings { });

// Guarde el resultado en su formato de documento de Word con corrector ortográfico
result.Save("Sample_SpellCheck.docx", SaveFormat.Docx, true, SpellChecker.SpellCheckLanguage.Eng);

Obtenga una licencia de API gratuita

¿Está interesado en probar la API en toda su capacidad sin limitaciones de evaluación? Puede solicitar una Licencia Temporal Gratuita.

Conclusión

En conclusión, ha explorado cómo convertir el texto de una imagen en un documento de Word que se puede editar o buscar con la función OCR mediante programación usando C#. Además, puede consultar la Documentación de la API para explorar otras funciones que ofrece la API. Además, no dude en contactarnos en el Foro de soporte gratuito para cualquiera de sus consultas.

Ver también