Em certos casos, poderemos precisar exportar dados de um formato para outro. Um requisito comum é a conversão de documentos do Word (DOC ou DOCX) em arquivos de texto simples (TXT).Neste artigo, aprenderemos como converter Word para TXT usando a biblioteca Java Word to Text Converter.
Este artigo cobre os seguintes tópicos:
- Conversor Java Word para Texto
- Passos para converter DOCX em TXT
- Converter Word em TXT em Java
- Converter Word em TXT on-line
- Recursos gratuitos
Biblioteca de conversão de Java Word para texto
Aspose.Words for Java é uma biblioteca poderosa para desenvolvedores que precisam trabalhar com documentos em seus programas Java. Ele permite que os desenvolvedores criem, editem e convertam documentos programaticamente em aplicativos Java. Você pode pensar nisso como um conjunto de ferramentas para trabalhar com documentos sem precisar do Microsoft Word. Usaremos esta biblioteca para converter documentos do Word em arquivos de texto simples. Ao utilizar a biblioteca Aspose.Words for Java, podemos converter facilmente arquivos DOC ou DOCX para o formato TXT, permitindo-nos extrair o texto de um documento do Word e salvá-lo como um arquivo de texto simples.
Por favor, baixe o JAR da API ou adicione a seguinte configuração pom.xml em um aplicativo Java baseado em Maven.
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://releases.aspose.com/java/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>24.3</version>
<classifier>jdk17</classifier>
</dependency>
<dependencies>
Etapas para converter Word DOC em TXT
Podemos exportar texto de documentos do Word e salvá-lo no formato TXT seguindo as etapas simples abaixo:
- Carregue o arquivo Word DOC/DOCX.
- Converta-o para o formato TXT.
- Salve o arquivo no local desejado.
Não precisamos processar manualmente todo o documento do Word, linha por linha ou página por página; podemos aproveitar as bibliotecas Java para extrair com eficiência o conteúdo do texto. Vamos explorar como conseguir isso em Java.
Converta um Word DOC em TXT em Java
Podemos converter facilmente um documento Word (DOC ou DOCX) em um arquivo TXT em Java seguindo as etapas abaixo:
- Primeiro, carregue o Word DOC/DOCX usando a classe Document.
- Em seguida, salve o documento como um arquivo TXT usando o método Document.save(filePath).
O exemplo de código a seguir mostra como converter um documento do Word para o formato TXT em Java.
// Este exemplo de código demonstra como salvar um arquivo DOCX como TXT
// Carregar arquivo do Word
Document doc = new Document("D:\\Files\\document.docx");
// Salvar documento como arquivo TXT
doc.save("D:\\Files\\doc-to-text.txt");
Obtenha uma licença gratuita
Você pode obter uma licença temporária gratuita para converter arquivos Word para o formato TXT sem limitações de avaliação.
Converter Word em TXT on-line
Você também pode usar este conversor Word para Texto gratuito para converter DOCX para TXT online. Exporte seu conteúdo textual de documentos do Word para um formato de texto simples de forma rápida e com alta qualidade e precisão.
DOCX para TXT – Recursos gratuitos
Além de converter seus arquivos DOC ou DOCX para o formato TXT, libere todo o potencial do Aspose.Words for Java. Explore funcionalidades avançadas como criação, edição, gerenciamento ou conversão de documentos e muito mais usando os seguintes recursos:
Conclusão
Nesta postagem do blog, aprendemos como converter Word em texto extraindo o conteúdo do texto de um documento do Word e salvando-o como um arquivo de texto simples. Converter Word em TXT em Java é uma tarefa simples que pode ser realizada usando a biblioteca Aspose.Words for Java. Portanto, da próxima vez que precisar converter um documento do Word em texto simples, você poderá usar o exemplo de código fornecido acima como um aplicativo inicial. Em caso de qualquer ambigüidade, sinta-se à vontade para nos contatar em nosso fórum de suporte gratuito.