Converter Word DOC em TXT em C#

No domínio do processamento de documentos, muitas vezes surge a necessidade de converter documentos do Word em formatos de texto simples mais simples. Seja para extração de dados, análise de conteúdo ou motivos de compatibilidade, a capacidade de converter arquivos Word (.doc, .docx) em texto simples (.txt) é uma habilidade valiosa para desenvolvedores. Nesta postagem do blog, exploraremos como converter um documento do Word para o formato TXT em um aplicativo C#.

Biblioteca C# para conversão de Word em TXT

Aspose.Words for .NET é uma biblioteca de processamento de documentos rica em recursos que permite aos desenvolvedores trabalhar com documentos do Word em vários formatos. Ele fornece um conjunto de APIs para criação, manipulação, conversão e renderização de documentos. Usaremos esta biblioteca para extrair conteúdo de documentos do Word como texto simples.

Para instalar a biblioteca do NuGet, você pode usar o seguinte comando. Ou você pode baixá-lo na seção Lançamentos.

PM> Install-Package Aspose.Words 

Etapas para converter Word DOC em TXT

Você pode extrair texto de documentos do Word e salvá-lo no formato TXT em algumas etapas, pois o Aspose.Words for .NET tornou isso bastante fácil. Abaixo estão as etapas que precisamos realizar para a conversão de Word em TXT.

  • Carregue o arquivo Word DOC/DOCX.
  • Converta-o para o formato TXT e salve o arquivo no local desejado.

Assim, você não precisa analisar todo o documento do Word e extrair o texto linha por linha ou página por página. Vamos agora escrever o código C# para extrair texto de um documento do Word.

Converter um Word DOC em TXT em C#

A seguir estão as etapas para salvar um documento Word DOC ou DOCX como um arquivo TXT em C#.

  • Primeiro, carregue o Word DOC/DOCX usando a classe Document.
  • Em seguida, salve o documento como um arquivo TXT usando o método Document.Save(filePath).

O seguinte trecho de código C# converte um documento do Word para o formato TXT.

// Carregar arquivo do Word
Document doc = new Document("document.docx");

// Salvar documento como arquivo TXT
doc.Save("doc-to-text.txt");

Use o conversor gratuito de C# Word para TXT

Você pode obter uma licença temporária gratuita para converter arquivos Word para o formato TXT sem limitações de avaliação.

Explore a biblioteca de palavras em C#

Você pode visitar a documentação da biblioteca C# Word para explorar outros recursos. Caso você tenha alguma dúvida, sinta-se à vontade para nos informar através do nosso fórum.

Conclusão

Nesta postagem do blog, exploramos como converter documentos do Word em arquivos TXT em C# usando Aspose.Words for .NET. Não há necessidade de analisar documentos inteiros do Word, basta extrair o texto simples de um documento em algumas etapas. Aspose.Words simplifica o processo de trabalho programaticamente com documentos do Word, fornecendo uma solução confiável e eficiente para tarefas de conversão de documentos. A integração desta biblioteca em seus projetos C# permite que você lide com o processamento de documentos com facilidade, abrindo um mundo de possibilidades para seus aplicativos.

Veja também