Texto de imagen a texto en Python | Texto de imagen de Python a texto

Convertir texto de imágenes a formatos editables es una tarea crucial para diversas aplicaciones. Ya sea que esté trabajando con documentos escaneados, tarjetas de presentación o notas escritas a mano, extraer texto de imágenes puede ahorrar mucho tiempo y mejorar la productividad. En esta publicación de blog, aprenderemos cómo convertir texto de imágenes a texto en Python.

Este artículo cubre los siguientes temas:

Convertidor de texto a texto de imagen de Python

Usaremos Aspose.OCR for Python para convertir texto de imágenes a texto (TXT).Aspose.OCR for Python es una potente biblioteca de reconocimiento óptico de caracteres (OCR) que permite a los desarrolladores extraer texto de imágenes y documentos escaneados en aplicaciones Python.

Primero, necesitamos instalar la biblioteca Aspose.OCR. Puede descargar el paquete fácilmente o instalar la API desde PyPI usando el siguiente comando pip en la consola:

pip install aspose-ocr-python-net 

Convertir texto de imagen a texto en Python

Podemos convertir texto de una imagen y guardarlo en un archivo de texto (TXT).Siga los pasos a continuación para extraer texto de imágenes mediante programación y guardarlo como un archivo de texto.

  1. Cree una instancia del objeto de clase AsposeOcr.
  2. Cree una instancia del objeto de clase OcrInput con InputType.SINGLEIMAGE como argumento.
  3. Agregue la imagen usando el método add().Del mismo modo, agregue más imágenes.
  4. Después de eso, llame al método reconocer() con el objeto OcrInput como argumento.
  5. Finalmente, guarde el resultado como un archivo de texto usando el método save().

El siguiente ejemplo de código muestra cómo convertir texto de una imagen a un archivo de texto en Python.

# Este ejemplo de código muestra cómo extraer texto de una imagen y guardarlo como archivo de texto en Python
import aspose.ocr as ocr

# Crear una instancia de la API Aspose.OCR
api = ocr.AsposeOcr()

# Agregar imagen al lote de reconocimiento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")

# Reconocer la imagen
result = api.recognize(img)

# Resultado del reconocimiento de impresión
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Convertidor de texto de imagen a texto en Python.

Convertidor de texto de imagen a texto en Python.

Texto de imagen a texto: método avanzado

De manera similar, podemos agregar filtros como “autoskew” y configurar opciones de reconocimiento como modos de área, idioma, etc. mientras convertimos texto de imágenes a archivos de texto. Siga los pasos a continuación para agregar filtros y configuraciones de reconocimiento.

  1. Cree una instancia del objeto de clase AsposeOcr.
  2. Inicialice un objeto de la clase PreprocessingFilters.
  3. Agregue los filtros usando el método add().
  4. Cree una instancia del objeto de clase OcrInput con InputType.SINGLEIMAGE y filtre el objeto como argumentos.
  5. Agregue la imagen usando el método add().Del mismo modo, agregue más imágenes.
  6. Inicialice el objeto de clase RecognitionSettings.
  7. Especifique las opciones de reconocimiento.
  8. Después de eso, llame al método reconocer() con el objeto OcrInput como argumento.
  9. Finalmente, guarde el resultado como un archivo de texto usando el método save().

El siguiente ejemplo de código muestra cómo especificar filtros y configuraciones de reconocimiento para convertir texto de una imagen a un archivo de texto en Python.

# Este ejemplo de código muestra cómo extraer texto en inglés de una imagen y guardarlo como archivo de texto en Python.
import aspose.ocr as ocr

# Crear una instancia de la API Aspose.OCR
api = ocr.AsposeOcr()

# establecer opciones de preprocesamiento
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())

# Agregar imagen al lote de reconocimiento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")

# Establecer opciones de reconocimiento
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG

# Reconocer
result = api.recognize(img, settings)

# Resultado del reconocimiento de impresión
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);

Biblioteca OCR de Python: obtenga una licencia gratuita

Visite nuestra página “Licencia temporal” para aprender cómo obtener una licencia gratuita fácilmente y desbloquear acceso ilimitado a la biblioteca OCR de Python. ¡Comience a convertir texto de imágenes a archivos de texto hoy!

Conversor de texto a texto de imagen: recursos gratuitos

Explore los recursos a continuación para descubrir más sobre las características y capacidades de la biblioteca:

Conclusión

En esta publicación de blog, hemos demostrado cómo usar Aspose.OCR for Python para convertir texto de imágenes a archivos TXT. Si sigue los pasos descritos anteriormente, puede integrar fácilmente la funcionalidad OCR en sus aplicaciones Python, lo que le permitirá extraer y procesar texto de varios tipos de imágenes. Ya sea que esté trabajando en la digitalización de documentos, la extracción de datos o cualquier otra tarea relacionada con OCR, Aspose.OCR proporciona una solución confiable y eficiente. ¡Feliz codificación!

En caso de cualquier ambigüedad, no dude en contactarnos en nuestro foro de soporte gratuito.

Ver también