Converter texto de imagens em formatos editáveis é uma tarefa crucial para diversas aplicações. Esteja você trabalhando com documentos digitalizados, cartões de visita ou notas manuscritas, extrair texto de imagens pode economizar tempo significativamente e aumentar a produtividade. Nesta postagem do blog, aprenderemos como converter texto de imagens em texto em Python.
Este artigo cobre os seguintes tópicos:
- Conversor de texto de imagem em texto em Python
- Converter texto de imagem em texto em Python
- Texto de imagem para texto - método avançado
- Recursos gratuitos
- Obtenha uma licença gratuita
Conversor de texto de imagem em texto em Python
Usaremos Aspose.OCR for Python para converter texto de imagens em texto (TXT).Aspose.OCR for Python é uma poderosa biblioteca de reconhecimento óptico de caracteres (OCR) que permite aos desenvolvedores extrair texto de imagens e documentos digitalizados em aplicativos Python.
Primeiro, precisamos instalar a biblioteca Aspose.OCR. Você pode facilmente baixar o pacote ou instalar a API de PyPI usando o seguinte comando pip no console:
pip install aspose-ocr-python-net
Converter texto de imagem em texto em Python
Podemos converter o texto de uma imagem e salvá-lo em um arquivo de texto (TXT).Siga as etapas abaixo para extrair programaticamente o texto das imagens e salvá-lo como um arquivo de texto.
- Crie uma instância do objeto de classe AsposeOcr.
- Instancie o objeto da classe OcrInput com InputType.SINGLEIMAGE como argumento.
- Adicione a imagem usando o método add().Da mesma forma, adicione mais imagens.
- Depois disso, chame o método reconhecer() com o objeto OcrInput como argumento.
- Finalmente, salve o resultado como um arquivo de texto usando o método save().
O exemplo de código a seguir mostra como converter texto de uma imagem em um arquivo de texto em Python.
# Este exemplo de código mostra como extrair texto de uma imagem e salvá-lo como arquivo de texto em Python
import aspose.ocr as ocr
# Instanciar API Aspose.OCR
api = ocr.AsposeOcr()
# Adicionar imagem ao lote de reconhecimento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("D:\\Files\\sample.jpg")
# Reconheça a imagem
result = api.recognize(img)
# Imprimir resultado de reconhecimento
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxt.txt", ocr.SaveFormat.TEXT);
Texto de imagem para texto - método avançado
Da mesma forma, podemos adicionar filtros como “autoskew” e definir opções de reconhecimento como modos de área, idioma, etc. ao converter texto de imagens em arquivos de texto. Siga as etapas abaixo para adicionar filtros e configurações de reconhecimento.
- Crie uma instância do objeto de classe AsposeOcr.
- Inicialize um objeto da classe PreprocessingFilters.
- Adicione os filtros usando o método add().
- Instancie o objeto da classe OcrInput com InputType.SINGLEIMAGE e filtre o objeto como argumentos.
- Adicione a imagem usando o método add().Da mesma forma, adicione mais imagens.
- Inicialize o objeto da classe RecognitionSettings.
- Especifique opções de reconhecimento.
- Depois disso, chame o método reconhecer() com o objeto OcrInput como argumento.
- Finalmente, salve o resultado como um arquivo de texto usando o método save().
O exemplo de código a seguir mostra como especificar filtros e configurações de reconhecimento para converter texto de uma imagem em um arquivo de texto em Python.
# Este exemplo de código mostra como extrair texto em inglês de uma imagem e salvá-lo como arquivo de texto em Python
import aspose.ocr as ocr
# Instanciar API Aspose.OCR
api = ocr.AsposeOcr()
# definir opções de pré-processamento
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.auto_skew())
# Adicionar imagem ao lote de reconhecimento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
img.add("D:\\Files\\sample.jpg")
# Definir opções de reconhecimento
settings = ocr.RecognitionSettings()
settings.threads_count = 1
settings.language = ocr.Language.ENG
# Reconhecer
result = api.recognize(img, settings)
# Imprimir resultado de reconhecimento
print(result[0].recognition_text)
result[0].save("D:\\Files\\ImageTexttoTxtSettings.txt", ocr.SaveFormat.TEXT);
Biblioteca Python OCR – Obtenha uma licença gratuita
Visite nossa página “Licença temporária” para saber como obter uma licença gratuita facilmente e desbloquear acesso ilimitado à biblioteca Python OCR. Comece a converter texto de imagens em arquivos de texto hoje mesmo!
Conversor de imagem de texto para texto – recursos gratuitos
Explore os recursos abaixo para descobrir mais sobre os recursos e capacidades da biblioteca:
- Guia do desenvolvedor: Dive into the detailed documentation to learn about advanced features and customization options.
- Aplicativos on-line gratuitos: Experience working applications live!
- Guias de instruções e artigos: Follow step-by-step guides to explore specific use cases and examples.
- Referência da API: Get detailed information on classes, methods, and parameters.
- Exemplos de código: Check out code snippets and sample projects to inspire your next project.
Conclusão
Nesta postagem do blog, demonstramos como usar Aspose.OCR for Python para converter texto de imagens em arquivos TXT. Seguindo as etapas descritas acima, você pode integrar facilmente a funcionalidade OCR em seus aplicativos Python, permitindo extrair e processar texto de vários tipos de imagens. Esteja você trabalhando na digitalização de documentos, extração de dados ou qualquer outra tarefa relacionada ao OCR, o Aspose.OCR oferece uma solução confiável e eficiente. Boa codificação!
Em caso de qualquer ambigüidade, sinta-se à vontade para nos contatar em nosso fórum de suporte gratuito.