Texto de imagen a Word en Python | Imagen a DOCX OCR

¿Estás cansado de transcribir manualmente texto a partir de imágenes? Si tiene una colección de documentos escaneados, capturas de pantalla o imágenes que contienen texto que desea editar, ¡no busque más! Puede realizar fácilmente OCR en imágenes JPG o PNG y extraer texto. En esta publicación de blog, exploraremos cómo convertir texto de imagen en documentos de Word en Python, facilitando el trabajo y la manipulación de datos de texto. Esta guía lo guiará a través del proceso de extracción de texto de imágenes con facilidad y le mostrará cómo guardarlo en formato DOCX.

Este artículo cubre los siguientes temas:

Texto de imagen a Word con la biblioteca OCR de Python

Usaremos Aspose.OCR for Python para convertir texto de imagen a Word en Python. Es una herramienta poderosa y eficiente para extraer texto de imágenes y convertirlo en documentos de Word editables. Con su avanzada tecnología OCR, reconoce y extrae texto con precisión de varios formatos de imagen, incluidos documentos escaneados, fotografías y capturas de pantalla.

Por favor descargue el paquete o instale la API desde PyPI usando el siguiente comando pip en la consola:

pip install aspose-ocr-python-net 

Convertir texto de imagen a Word en Python

Podemos reconocer y leer fácilmente texto de una imagen y convertirlo a un documento de Word. Siga estos pasos para extraer y editar texto de imágenes mediante programación.

  1. Inicialice el objeto de clase OcrInput con InputType.SINGLEIMAGE como argumento.
  2. Agregue la imagen usando el método add().
  3. Cree una instancia del objeto de clase AsposeOcr.
  4. Después de eso, llame al método reconocer() con el objeto OcrInput como argumento.
  5. Finalmente, guarde el resultado como un archivo DOCX usando el método save().

El siguiente ejemplo de código muestra cómo convertir texto de imagen en un documento de Word en Python.

# ¡Este ejemplo de código demuestra cómo convertir texto de imagen a Word en Python!
import aspose.ocr as ocr

# Agregar imagen al lote de reconocimiento
inputImg = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
inputImg.add("sample.jpg")

# Crear una instancia de la API Aspose.OCR
api = ocr.AsposeOcr()

# Reconocer la imagen
result = api.recognize(inputImg)

# Resultado del reconocimiento de impresión
print(result[0].recognition_text)
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX);
Convertidor de texto de imagen a palabra en Python.

Convertidor de texto de imagen a palabra en Python.

Texto de imagen a Word – Recursos gratuitos

¿Quiere hacer más con la conversión de texto de imagen a Word en Python? Consulte los recursos a continuación para obtener más información sobre las funciones de la biblioteca y ver qué más puede hacer.

Biblioteca OCR de Python: obtenga una licencia gratuita

¡Comience con la conversión de texto de imagen a Word de forma gratuita! Visite la página ‘Licencia temporal’ para aprender cómo obtener fácilmente una licencia temporal gratuita, lo que le permitirá probar la biblioteca sin restricciones.

Conclusión

En esta publicación de blog, exploramos cómo convertir texto de imagen en documentos de Word editables. Al aprovechar Aspose.OCR for Python, podemos extraer texto de imágenes de manera eficiente y convertirlo al formato Word, ahorrando tiempo y aumentando la productividad. La biblioteca admite más de 100 idiomas y ofrece opciones de salida flexibles, lo que la convierte en una opción popular para desarrolladores y empresas que buscan automatizar tareas de procesamiento de documentos. Con los pasos descritos en esta guía, puede extraer texto de imágenes mediante programación, automatizar tareas de procesamiento de documentos, extraer datos de documentos escaneados y más. ¡Así que adelante, pruébalo y desbloquea el potencial de la conversión de imagen a texto en tus proyectos!

En caso de cualquier ambigüedad, no dude en contactarnos en nuestro foro de soporte gratuito.

Ver también