Converti Word DOC in TXT in C#

Nell’ambito dell’elaborazione dei documenti, spesso sorge la necessità di convertire i documenti Word in formati di testo semplice e semplice. Che sia per l’estrazione dei dati, l’analisi del contenuto o per ragioni di compatibilità, la capacità di convertire file Word (.doc, .docx) in testo semplice (.txt) è una competenza preziosa per gli sviluppatori. In questo post del blog esploreremo come convertire un documento Word in formato TXT in un’applicazione C#.

Libreria C# per la conversione da Word a TXT

Aspose.Words for .NET è una libreria di elaborazione di documenti ricca di funzionalità che consente agli sviluppatori di lavorare con documenti Word in vari formati. Fornisce una serie di API per la creazione, la manipolazione, la conversione e il rendering dei documenti. Utilizzeremo questa libreria per estrarre il contenuto dai documenti Word come testo semplice.

Per installare la libreria da NuGet, è possibile utilizzare il comando seguente. Oppure puoi scaricarlo dalla sezione Versioni.

PM> Install-Package Aspose.Words 

Passaggi per convertire Word DOC in TXT

Puoi estrarre testo da documenti Word e salvarlo in formato TXT in un paio di passaggi, poiché Aspose.Words for .NET lo ha reso abbastanza semplice. Di seguito sono riportati i passaggi che dobbiamo eseguire per la conversione da Word a TXT.

  • Carica il file Word DOC/DOCX.
  • Convertilo in formato TXT e salva il file nella posizione desiderata.

Quindi non devi analizzare l’intero documento Word ed estrarre il testo riga per riga o pagina per pagina. Scriviamo ora il codice C# per estrarre il testo da un documento Word.

Converti un DOC Word in TXT in C#

Di seguito sono riportati i passaggi per salvare un documento Word DOC o DOCX come file TXT in C#.

  • Innanzitutto, carica Word DOC/DOCX utilizzando la classe Document.
  • Quindi, salva il documento come file TXT utilizzando il metodo Document.Save(filePath).

Il seguente frammento di codice C# converte un documento Word in formato TXT.

// Carica il file Word
Document doc = new Document("document.docx");

// Salva il documento come file TXT
doc.Save("doc-to-text.txt");

Utilizza il convertitore gratuito da C# Word a TXT

Puoi ottenere una licenza temporanea gratuita per convertire file Word in formato TXT senza limitazioni di valutazione.

Esplora la libreria di parole C#

Puoi visitare la documentazione della libreria C# Word per esplorare altre funzionalità. In caso di domande, non esitate a farcelo sapere tramite il nostro forum.

Conclusione

In questo post del blog, abbiamo esplorato come convertire documenti Word in file TXT in C# utilizzando Aspose.Words for .NET. Non è necessario analizzare interi documenti Word, è sufficiente estrarre il testo normale da un documento in un paio di passaggi. Aspose.Words semplifica il processo di lavoro con i documenti Word a livello di codice, fornendo una soluzione affidabile ed efficiente per le attività di conversione dei documenti. L’integrazione di questa libreria nei tuoi progetti C# ti consente di gestire facilmente l’elaborazione dei documenti, aprendo un mondo di possibilità per le tue applicazioni.

Guarda anche