使用 Java 将 Word 转换为 TXT | DOCX 转换为 TXT | Java Word 转换为文本

在某些情况下,我们可能需要将数据从一种格式导出为另一种格式。一项常见要求是将 Word 文档(DOCDOCX)转换为纯文本(TXT)文件。在本文中,我们将学习如何使用 Java Word to Text Converter 库将 Word 转换为 TXT。

本文涵盖以下主题:

Java Word 到文本转换器库

Aspose.Words for Java 是一个功能强大的库,适合需要在 Java 程序中处理文档的开发人员。它允许开发人员在 Java 应用程序中以编程方式创建、编辑和转换文档。您可以将其视为无需 Microsoft Word 即可处理文档的工具集。我们将使用该库将 Word 文档转换为纯文本文件。通过利用Aspose.Words for Java库,我们可以轻松地将DOC或DOCX文件转换为TXT格式,从而使我们能够从Word文档中提取文本并将其另存为简单的文本文件。

下载 API 的 JAR 或在基于 Maven 的 Java 应用程序中添加以下 pom.xml 配置。

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://releases.aspose.com/java/repo/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>24.3</version>
        <classifier>jdk17</classifier>
    </dependency>
<dependencies>

将 Word DOC 转换为 TXT 的步骤

我们可以按照以下简单步骤从Word文档中导出文本并将其保存为TXT格式:

  • 加载 Word DOC/DOCX 文件。
  • 将其转换为 TXT 格式。
  • 将文件保存到所需位置。

我们不需要手动逐行或逐页处理整个Word文档;我们可以利用Java库来有效地提取文本内容。让我们探讨一下如何在 Java 中实现这一点。

在 Java 中将 Word DOC 转换为 TXT

我们可以通过以下步骤轻松地将Word(DOC或DOCX)文档转换为Java中的TXT文件:

  • 首先,使用 Document 类加载 Word DOC/DOCX。
  • 然后,使用 Document.save(filePath) 方法将文档保存为 TXT 文件。

以下代码示例展示了如何使用 Java 将 Word 文档转换为 TXT 格式。

// 此代码示例演示如何将 DOCX 文件另存为 TXT
// 加载Word文件
Document doc = new Document("D:\\Files\\document.docx");

// 将文档另存为 TXT 文件
doc.save("D:\\Files\\doc-to-text.txt");
在 Java 中将 Word DOC 转换为 TXT

在 Java 中将 Word DOC 转换为 TXT

获取免费许可证

您可以获得免费临时许可证,将 Word 文件转换为 TXT 格式,没有评估限制。

在线将Word转换为TXT

您还可以使用这个免费的Word to Text converter在线将DOCX转换为TXT。快速、高质量、准确地将文本内容从 Word 文档导出为纯文本格式。

DOCX 到 TXT – 免费资源

除了将 DOC 或 DOCX 文件转换为 TXT 格式之外,还可以释放 Aspose.Words for Java 的全部潜力。使用以下资源探索高级功能,例如创建、编辑、管理或转换文档等:

结论

在这篇博文中,我们学习了如何通过从 Word 文档中提取文本内容并将其保存为纯文本文件来将 Word 转换为文本。在 Java 中将 Word 转换为 TXT 是一项简单的任务,可以使用 Aspose.Words for Java 库来完成。因此,下次您发现自己需要将 Word 文档转换为纯文本时,可以使用上面提供的代码示例作为入门应用程序。如有任何疑问,请随时通过我们的免费支持论坛与我们联系。

也可以看看