Перетворення Word на TXT у Java | DOCX в TXT | Java Word в текст

У деяких випадках нам може знадобитися експортувати дані з одного формату в інший. Однією з поширених вимог є перетворення документів Word (DOC або DOCX) у файли звичайного тексту (TXT).У цій статті ми дізнаємося, як конвертувати Word у TXT за допомогою бібліотеки Java Word to Text Converter.

Ця стаття охоплює такі теми:

Бібліотека конвертера Java Word to Text

Aspose.Words for Java — це потужна бібліотека для розробників, яким потрібно працювати з документами у своїх програмах на Java. Це дозволяє розробникам створювати, редагувати та конвертувати документи програмним шляхом у програмах Java. Ви можете розглядати його як набір інструментів для роботи з документами без використання Microsoft Word. Ми будемо використовувати цю бібліотеку для перетворення документів Word у звичайні текстові файли. Використовуючи бібліотеку Aspose.Words for Java, ми можемо легко конвертувати файли DOC або DOCX у формат TXT, дозволяючи нам витягувати текст із документа Word і зберігати його як простий текстовий файл.

Будь ласка, завантажте JAR API або додайте наступну конфігурацію pom.xml у програму Java на основі Maven.

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://releases.aspose.com/java/repo/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>24.3</version>
        <classifier>jdk17</classifier>
    </dependency>
<dependencies>

Кроки для перетворення Word DOC на TXT

Ми можемо експортувати текст із документів Word і зберегти його у форматі TXT, дотримуючись простих кроків, наведених нижче:

  • Завантажте файл Word DOC/DOCX.
  • Перетворіть його у формат TXT.
  • Збережіть файл у потрібному місці.

Нам не потрібно вручну обробляти весь документ Word рядок за рядком або сторінку за сторінкою; ми можемо використовувати бібліотеки Java для ефективного вилучення текстового вмісту. Давайте дослідимо, як цього досягти в Java.

Перетворіть Word DOC на TXT у Java

Ми можемо легко конвертувати документ Word (DOC або DOCX) у файл TXT у Java, виконавши наведені нижче дії.

  • Спочатку завантажте Word DOC/DOCX за допомогою класу Document.
  • Потім збережіть документ як файл TXT за допомогою методу Document.save(filePath).

У наведеному нижче прикладі коду показано, як конвертувати документ Word у формат TXT у Java.

// Цей приклад коду демонструє, як зберегти файл DOCX як TXT
// Завантажити файл Word
Document doc = new Document("D:\\Files\\document.docx");

// Зберегти документ як файл TXT
doc.save("D:\\Files\\doc-to-text.txt");
Перетворіть Word DOC на TXT у Java

Перетворіть Word DOC на TXT у Java

Отримайте безкоштовну ліцензію

Ви можете отримати безкоштовну тимчасову ліцензію, щоб конвертувати файли Word у формат TXT без обмежень оцінювання.

Перетворення Word на TXT онлайн

Ви також можете скористатися цим безкоштовним конвертером Word to Text, щоб конвертувати DOCX у TXT онлайн. Експортуйте свій текстовий вміст із документів Word у формат звичайного тексту швидко, з високою якістю й точністю.

DOCX у TXT – безкоштовні ресурси

Окрім перетворення файлів DOC або DOCX у формат TXT, розкрийте весь потенціал Aspose.Words for Java. Ознайомтеся з такими розширеними функціями, як створення, редагування, керування або перетворення документів тощо, використовуючи такі ресурси:

Висновок

У цій публікації блогу ми дізналися, як конвертувати Word у текст, витягнувши текстовий вміст із документа Word і зберігши його як звичайний текстовий файл. Перетворення Word на TXT у Java — це просте завдання, яке можна виконати за допомогою бібліотеки Aspose.Words for Java. Тож наступного разу, коли вам знадобиться перетворити документ Word на звичайний текст, ви можете використати наведений вище зразок коду як початкову програму. У разі будь-яких неясностей зв’яжіться з нами на нашому безкоштовному форумі підтримки.

Дивись також