Преобразование Word DOC в TXT на C#

В области обработки документов часто возникает необходимость конвертировать документы Word в более простые текстовые форматы. Будь то извлечение данных, анализ контента или по соображениям совместимости, возможность конвертировать файлы Word (.doc, .docx) в обычный текст (.txt) является ценным навыком для разработчиков. В этой записи блога мы рассмотрим, как преобразовать документ Word в формат TXT в приложении C#.

Библиотека C# для преобразования Word в TXT

Aspose.Words for .NET — это многофункциональная библиотека обработки документов, которая позволяет разработчикам работать с документами Word в различных форматах. Он предоставляет набор API-интерфейсов для создания, манипулирования, преобразования и рендеринга документов. Мы будем использовать эту библиотеку для извлечения содержимого из документов Word в виде обычного текста.

Чтобы установить библиотеку из NuGet, вы можете использовать следующую команду. Или вы можете скачать его из раздела Релизы.

PM> Install-Package Aspose.Words 

Действия по преобразованию Word DOC в TXT

Вы можете извлечь текст из документов Word и сохранить его в формате TXT за пару шагов, поскольку Aspose.Words for .NET сделал это довольно легко. Ниже приведены шаги, которые необходимо выполнить для преобразования Word в TXT.

  • Загрузите файл Word DOC/DOCX.
  • Конвертируйте его в формат TXT и сохраните файл в нужном месте.

Таким образом, вам не придется анализировать весь документ Word и извлекать текст построчно или страницу за страницей. Давайте теперь напишем код C# для извлечения текста из документа Word.

Преобразование Word DOC в TXT на C#

Ниже приведены шаги по сохранению документа Word DOC или DOCX в виде файла TXT на C#.

  • Сначала загрузите Word DOC/DOCX, используя класс Document.
  • Затем сохраните документ как файл TXT, используя метод Document.Save(filePath).

Следующий фрагмент кода C# преобразует документ Word в формат TXT.

// Загрузить файл Word
Document doc = new Document("document.docx");

// Сохранить документ как файл TXT
doc.Save("doc-to-text.txt");

Используйте бесплатный конвертер C# Word в TXT

Вы можете получить бесплатную временную лицензию для преобразования файлов Word в формат TXT без ограничений ознакомительной версии.

Изучите библиотеку C# Word

Вы можете посетить документацию библиотеки C# Word, чтобы изучить другие возможности. Если у вас возникнут вопросы, задайте их нам на форум.

Заключение

В этом сообщении блога мы рассмотрели, как конвертировать документы Word в файлы TXT на C# с помощью Aspose.Words for .NET. Нет необходимости анализировать целые документы Word, просто извлеките простой текст из документа за пару шагов. Aspose.Words упрощает процесс работы с документами Word программным путем, предоставляя надежное и эффективное решение задач преобразования документов. Интеграция этой библиотеки в ваши проекты C# позволит вам с легкостью обрабатывать документы, открывая мир возможностей для ваших приложений.

Смотрите также