Перетворення Word DOC на TXT на C#

У сфері обробки документів часто виникає потреба конвертувати документи Word у простіші текстові формати. Здатність перетворювати файли Word (.doc, .docx) у звичайний текст (.txt) є цінною навичкою для розробників, незалежно від того, чи це стосується вилучення даних, аналізу вмісту чи міркувань сумісності. У цій публікації блогу ми розглянемо, як перетворити документ Word у формат TXT у програмі C#.

Бібліотека C# для перетворення Word у TXT

Aspose.Words for .NET — це багатофункціональна бібліотека обробки документів, яка дозволяє розробникам працювати з документами Word у різних форматах. Він надає набір API для створення документів, обробки, перетворення та візуалізації. Ми будемо використовувати цю бібліотеку, щоб видобувати вміст із документів Word як звичайний текст.

Щоб установити бібліотеку з NuGet, ви можете використати таку команду. Або ви можете завантажити його з розділу Релізи.

PM> Install-Package Aspose.Words 

Кроки для перетворення Word DOC на TXT

Ви можете витягнути текст із документів Word і зберегти його у форматі TXT за кілька кроків, оскільки Aspose.Words for .NET зробив це досить легко. Нижче наведено кроки, які нам потрібно виконати для перетворення Word у TXT.

  • Завантажте файл Word DOC/DOCX.
  • Перетворіть його у формат TXT і збережіть файл у потрібному місці.

Тому вам не потрібно аналізувати весь документ Word і витягувати текст рядок за рядком або сторінку за сторінкою. Давайте тепер напишемо код C#, щоб витягнути текст із документа Word.

Перетворення Word DOC на TXT у C#

Нижче наведено кроки, щоб зберегти документ Word DOC або DOCX як файл TXT у C#.

  • Спочатку завантажте Word DOC/DOCX за допомогою класу Document.
  • Потім збережіть документ як файл TXT за допомогою методу Document.Save(filePath).

Наведений нижче фрагмент коду C# перетворює документ Word у формат TXT.

// Завантажити файл Word
Document doc = new Document("document.docx");

// Зберегти документ як файл TXT
doc.Save("doc-to-text.txt");

Використовуйте безкоштовний конвертер C# Word у TXT

Ви можете отримати безкоштовну тимчасову ліцензію, щоб конвертувати файли Word у формат TXT без обмежень оцінки.

Дослідіть бібліотеку C# Word

Ви можете відвідати документацію бібліотеки C# Word, щоб дослідити інші функції. Якщо у вас виникнуть запитання, не соромтеся повідомити нас через наш форум.

Висновок

У цій публікації блогу ми досліджували, як конвертувати документи Word у файли TXT у C# за допомогою Aspose.Words for .NET. Не потрібно аналізувати цілі документи Word, просто витягніть звичайний текст із документа за кілька кроків. Aspose.Words спрощує процес програмної роботи з документами Word, надаючи надійне та ефективне рішення для завдань конвертації документів. Інтеграція цієї бібліотеки у ваші проекти C# дає вам змогу з легкістю обробляти документи, відкриваючи цілий світ можливостей для ваших програм.

Дивись також