Converter DOCX para TXT em Python

Os formatos MS Word DOC e DOCX são comumente usados para criar documentos rich text. Você pode adicionar texto, tabelas, gráficos, animações e vários outros elementos a documentos DOC/DOCX. No entanto, em certos casos, por exemplo, para analisar e analisar o texto nos documentos do Word, você precisa converter arquivos DOC/DOCX para o formato TXT programaticamente. Para conseguir isso, este artigo aborda como converter um arquivo DOC ou DOCX para o formato TXT em Python.

Biblioteca de conversores Python DOC/DOCX para TXT

Para salvar arquivos DOC e DOCX no formato TXT, usaremos Aspose.Words for Python. É uma biblioteca poderosa e de alta velocidade que fornece vários recursos para criar e manipular documentos de texto sem problemas. Além disso, oferece uma conversão de alta qualidade de documentos para outros formatos. Você pode instalar a biblioteca em seu aplicativo Python de PyPI usando o seguinte comando pip.

> pip install aspose-words

Converter DOCX para TXT em Python

Vamos ver como converter um arquivo DOCX para TXT em Python. Para isso, basta carregar o arquivo DOCX e salvá-lo como um arquivo TXT. A seguir estão as etapas para salvar um arquivo DOCX no formato TXT em Python.

  • Carregue o arquivo DOCX usando a classe Document.
  • Salve DOCX como TXT usando o método Document.save().

O exemplo de código a seguir mostra como realizar a conversão de DOCX para TXT em Python.

import aspose.words as aw

# Carregar documento DOC/DOCX
doc = aw.Document("Input.docx")

# Salvar como TXT
doc.save("Output.txt")

Obtenha uma licença gratuita

Você pode obter uma licença temporária gratuita para usar o Aspose.Words for Python sem limitações de avaliação.

Conclusão

Neste artigo, você aprendeu como converter arquivos DOC ou DOCX para o formato TXT em Python. Esse recurso permite extrair o texto de arquivos DOCX e salvá-lo na forma de um arquivo TXT simples. Assim, você pode analisar o texto de forma mais conveniente. Além disso, você pode aprender mais sobre a biblioteca usando a documentação. Além disso, você pode compartilhar suas perguntas ou dúvidas através do nosso fórum.

Veja também