Texto de imagem para texto em Python | Texto de imagem Python para texto

Converter texto de imagens em formatos editáveis é uma tarefa crucial para diversas aplicações. Esteja você trabalhando com documentos digitalizados, cartões de visita ou notas manuscritas, extrair texto de imagens pode economizar tempo significativamente e aumentar a produtividade. Nesta postagem do blog, aprenderemos como converter texto de imagens em texto em Python.

Este artigo cobre os seguintes tópicos:

Conversor de texto de imagem em texto em Python

Usaremos Aspose.OCR for Python para converter texto de imagens em texto (TXT).Aspose.OCR for Python é uma poderosa biblioteca de reconhecimento óptico de caracteres (OCR) que permite aos desenvolvedores extrair texto de imagens e documentos digitalizados em aplicativos Python.

Primeiro, precisamos instalar a biblioteca Aspose.OCR. Você pode facilmente baixar o pacote ou instalar a API de PyPI usando o seguinte comando pip no console:

pip install aspose-ocr-python-net 

Converter texto de imagem em texto em Python

Podemos converter o texto de uma imagem e salvá-lo em um arquivo de texto (TXT).Siga as etapas abaixo para extrair programaticamente o texto das imagens e salvá-lo como um arquivo de texto.

  1. Crie uma instância do objeto de classe AsposeOcr.
  2. Instancie o objeto da classe OcrInput com InputType.SINGLEIMAGE como argumento.
  3. Adicione a imagem usando o método add().Da mesma forma, adicione mais imagens.
  4. Depois disso, chame o método reconhecer() com o objeto OcrInput como argumento.
  5. Finalmente, salve o resultado como um arquivo de texto usando o método save().

O exemplo de código a seguir mostra como converter texto de uma imagem em um arquivo de texto em Python.

# Este exemplo de código mostra como extrair texto de uma imagem e salvá-lo como arquivo de texto em Python
import aspose.ocr as ocr

# Instanciar API Aspose.OCR
api = ocr.AsposeOcr()

# Adicionar imagem ao lote de reconhecimento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")

# Reconheça a imagem
result = api.recognize(img)

# Imprimir resultado de reconhecimento
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Conversor de texto de imagem para texto em Python.

Conversor de texto de imagem para texto em Python.

Texto de imagem para texto - método avançado

Da mesma forma, podemos adicionar filtros como “autoskew” e definir opções de reconhecimento como modos de área, idioma, etc. ao converter texto de imagens em arquivos de texto. Siga as etapas abaixo para adicionar filtros e configurações de reconhecimento.

  1. Crie uma instância do objeto de classe AsposeOcr.
  2. Inicialize um objeto da classe PreprocessingFilters.
  3. Adicione os filtros usando o método add().
  4. Instancie o objeto da classe OcrInput com InputType.SINGLEIMAGE e filtre o objeto como argumentos.
  5. Adicione a imagem usando o método add().Da mesma forma, adicione mais imagens.
  6. Inicialize o objeto da classe RecognitionSettings.
  7. Especifique opções de reconhecimento.
  8. Depois disso, chame o método reconhecer() com o objeto OcrInput como argumento.
  9. Finalmente, salve o resultado como um arquivo de texto usando o método save().

O exemplo de código a seguir mostra como especificar filtros e configurações de reconhecimento para converter texto de uma imagem em um arquivo de texto em Python.

# Este exemplo de código mostra como extrair texto em inglês de uma imagem e salvá-lo como arquivo de texto em Python
import aspose.ocr as ocr

# Instanciar API Aspose.OCR
api = ocr.AsposeOcr()

# definir opções de pré-processamento
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())

# Adicionar imagem ao lote de reconhecimento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")

# Definir opções de reconhecimento
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG

# Reconhecer
result = api.recognize(img, settings)

# Imprimir resultado de reconhecimento
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);

Biblioteca Python OCR – Obtenha uma licença gratuita

Visite nossa página “Licença temporária” para saber como obter uma licença gratuita facilmente e desbloquear acesso ilimitado à biblioteca Python OCR. Comece a converter texto de imagens em arquivos de texto hoje mesmo!

Conversor de imagem de texto para texto – recursos gratuitos

Explore os recursos abaixo para descobrir mais sobre os recursos e capacidades da biblioteca:

Conclusão

Nesta postagem do blog, demonstramos como usar Aspose.OCR for Python para converter texto de imagens em arquivos TXT. Seguindo as etapas descritas acima, você pode integrar facilmente a funcionalidade OCR em seus aplicativos Python, permitindo extrair e processar texto de vários tipos de imagens. Esteja você trabalhando na digitalização de documentos, extração de dados ou qualquer outra tarefa relacionada ao OCR, o Aspose.OCR oferece uma solução confiável e eficiente. Boa codificação!

Em caso de qualquer ambigüidade, sinta-se à vontade para nos contatar em nosso fórum de suporte gratuito.

Veja também