Преобразование Word в TXT в Java | DOCX в TXT | Java Word в текст

В некоторых случаях нам может потребоваться экспортировать данные из одного формата в другой. Одним из распространенных требований является преобразование документов Word (DOC или DOCX) в файлы обычного текста (TXT).В этой статье мы узнаем, как конвертировать Word в TXT с помощью библиотеки Java Word to Text Converter.

В этой статье рассматриваются следующие темы:

Библиотека конвертера Java Word в текст

Aspose.Words for Java — мощная библиотека для разработчиков, которым необходимо работать с документами в своих Java-программах. Он позволяет разработчикам программно создавать, редактировать и конвертировать документы в приложениях Java. Вы можете думать об этом как о наборе инструментов для работы с документами без использования Microsoft Word. Мы будем использовать эту библиотеку для преобразования документов Word в обычные текстовые файлы. Используя библиотеку Aspose.Words for Java, мы можем легко конвертировать файлы DOC или DOCX в формат TXT, что позволяет нам извлекать текст из документа Word и сохранять его как простой текстовый файл.

Пожалуйста, загрузите JAR API или добавьте следующую конфигурацию pom.xml в приложение Java на основе Maven.

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://releases.aspose.com/java/repo/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>24.3</version>
        <classifier>jdk17</classifier>
    </dependency>
<dependencies>

Действия по преобразованию Word DOC в TXT

Мы можем экспортировать текст из документов Word и сохранить его в формате TXT, выполнив простые шаги, приведенные ниже:

  • Загрузите файл Word DOC/DOCX.
  • Конвертируйте его в формат TXT.
  • Сохраните файл в нужное место.

Нам не нужно вручную обрабатывать весь документ Word построчно или страницу за страницей; мы можем использовать библиотеки Java для эффективного извлечения текстового содержимого. Давайте рассмотрим, как добиться этого в Java.

Преобразование Word DOC в TXT на Java

Мы можем легко преобразовать документ Word (DOC или DOCX) в файл TXT на Java, выполнив следующие действия:

  • Сначала загрузите Word DOC/DOCX, используя класс Document.
  • Затем сохраните документ как файл TXT, используя метод Document.save(filePath).

В следующем примере кода показано, как преобразовать документ Word в формат TXT на Java.

// В этом примере кода показано, как сохранить файл DOCX в формате TXT.
// Загрузить файл Word
Document doc = new Document("D:\\Files\\document.docx");

// Сохранить документ как файл TXT
doc.save("D:\\Files\\doc-to-text.txt");
Преобразование Word DOC в TXT на Java

Преобразование Word DOC в TXT на Java

Получите бесплатную лицензию

Вы можете получить бесплатную временную лицензию для преобразования файлов Word в формат TXT без ограничений ознакомительной версии.

Конвертировать Word в TXT онлайн

Вы также можете использовать этот бесплатный конвертер Word в текст для конвертации DOCX в TXT онлайн. Экспортируйте текстовое содержимое из документов Word в обычный текстовый формат быстро, с высоким качеством и точностью.

DOCX в TXT – бесплатные ресурсы

Помимо преобразования файлов DOC или DOCX в формат TXT, раскройте весь потенциал Aspose.Words for Java. Изучите расширенные функции, такие как создание, редактирование, управление или преобразование документов и многое другое, используя следующие ресурсы:

Заключение

В этом сообщении блога мы узнали, как преобразовать Word в текст, извлекая текстовое содержимое из документа Word и сохраняя его как обычный текстовый файл. Преобразование Word в TXT в Java — это простая задача, которую можно выполнить с помощью библиотеки Aspose.Words for Java. Поэтому в следующий раз, когда вам понадобится преобразовать документ Word в обычный текст, вы можете использовать приведенный выше пример кода в качестве начального приложения. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на нашем бесплатном форуме поддержки.

Смотрите также