Questo articolo fornisce il modo più semplice per estrarre testo normale dai file Word DOCX o DOC nelle applicazioni Python. Dopo aver letto questo articolo, imparerai come convertire un file DOCX o DOC in TXT in Python.

Converti DOC DOCX in TXT in Python

MS Word è una popolare applicazione di elaborazione testi che consente di creare documenti RTF. In MS Word viene creata un’ampia gamma di documenti, comprese fatture, documenti tecnici, rapporti e così via. DOC e DOCX sono i formati di file utilizzati da MS Word per archiviare i documenti.

Come programmatore, potrebbe essere necessario elaborare una serie di file Word DOC/DOCX per estrarre il testo normale dalle applicazioni Python. Vediamo quindi come eseguire la conversione da DOC o DOCX a TXT in Python.

Convertitore Python da DOCX a TXT - Download gratuito

Aspose.Words for Python è una straordinaria libreria con un’ampia gamma di funzionalità per manipolare documenti di testo popolari tra cui DOC e DOCX. La libreria facilita il modo di elaborare e recuperare il testo dai documenti di Word. Pertanto, utilizzeremo questa libreria per convertire i file DOC/DOCX in formato TXT.

Puoi usare il comando pip seguente per installare Aspose.Words for Python nella tua applicazione.

pip install aspose-words

Come convertire DOCX in TXT in Python

Aspose.Words for Python semplifica la conversione da DOCX a TXT che puoi eseguire in un paio di passaggi, come indicato di seguito:

  • Carica il file DOCX dal disco.
  • Salva DOCX come formato TXT nella posizione desiderata.

Non è necessario analizzare l’intero documento di Word pagina per pagina o riga per riga per estrarre il testo da esso. Diamo ora un’occhiata a come eseguire questi passaggi in Python per convertire un file DOCX in formato TXT.

Salva DOC come TXT in Python

Di seguito sono riportati i passaggi per salvare un file DOC o DOCX come TXT in Python.

  • Carica il file DOC utilizzando la classe Document.
  • Salva DOC come TXT usando il metodo Document.save(filePath) e passa il percorso del file come parametro.

L’esempio di codice seguente mostra come convertire un DOC in TXT in Python.

import aspose.words as aw

# Carica file DOC
doc = aw.Document("document.doc")

# Salva DOC come TXT
doc.save("doc-to-text.txt")

Convertitore da Python DOC a TXT: ottieni una licenza gratuita

Puoi utilizzare una licenza temporanea gratuita per convertire i file DOC in formato TXT senza limitazioni di valutazione.

Conclusione

In questo articolo, hai imparato come convertire file DOC o DOCX in formato TXT in Python. Con l’aiuto del codice di esempio, hai visto come caricare e salvare file DOCX come TXT nella posizione desiderata in Python. Inoltre, puoi visitare la documentazione di Aspose.Words for Python per esplorare di più sulla libreria. In caso di domande, non esitare a farcelo sapere tramite il nostro forum.

Guarda anche