Convertir DOCX a TXT en Python

Los formatos de MS Word DOC y DOCX se usan comúnmente para crear documentos de texto enriquecido. Puede agregar texto, tablas, gráficos, animaciones y varios otros elementos a los documentos DOC/DOCX. Sin embargo, en ciertos casos, por ejemplo, para analizar y analizar el texto en los documentos de Word, debe convertir los archivos DOC/DOCX al formato TXT mediante programación. Para lograrlo, este artículo cubre cómo convertir un archivo DOC o DOCX a formato TXT en Python.

Biblioteca de conversión de DOC/DOCX a TXT de Python

Para guardar archivos DOC y DOCX en formato TXT, usaremos Aspose.Words for Python. Es una biblioteca potente y de alta velocidad que proporciona un montón de funciones para crear y manipular documentos de texto sin problemas. Además, ofrece una conversión de alta calidad de documentos a otros formatos. Puede instalar la biblioteca en su aplicación Python desde PyPI usando el siguiente comando pip.

> pip install aspose-words

Convertir DOCX a TXT en Python

Veamos cómo convertir un archivo DOCX a TXT en Python. Para esto, solo necesita cargar el archivo DOCX y guardarlo como un archivo TXT. Los siguientes son los pasos para guardar un archivo DOCX en formato TXT en Python.

  • Cargue el archivo DOCX usando la clase Document.
  • Guarde DOCX como TXT usando el método Document.save().

El siguiente ejemplo de código muestra cómo realizar la conversión de DOCX a TXT en Python.

import aspose.words as aw

# Load DOC/DOCX document
doc = aw.Document("Input.docx")

# Save as TXT
doc.save("Output.txt")

Obtenga una licencia gratis

Puede obtener una licencia temporal gratuita para usar Aspose.Words for Python sin limitaciones de evaluación.

Conclusión

En este artículo, ha aprendido cómo convertir archivos DOC o DOCX a formato TXT en Python. Esta función le permite extraer el texto de los archivos DOCX y guardarlo en forma de un archivo TXT sin formato. Por lo tanto, puede analizar el texto de manera más conveniente. Además, puede obtener más información sobre la biblioteca utilizando la documentación. Además, puede compartir sus preguntas o consultas a través de nuestro foro.

Ver también