Převést Word DOC na TXT v C#

V oblasti zpracování dokumentů často vyvstává potřeba převádět dokumenty Wordu do jednodušších formátů prostého textu. Ať už jde o extrakci dat, analýzu obsahu nebo z důvodů kompatibility, schopnost převádět soubory Wordu (.doc, .docx) na prostý text (.txt) je pro vývojáře cennou dovedností. V tomto příspěvku na blogu prozkoumáme, jak převést dokument aplikace Word do formátu TXT v aplikaci C#.

Knihovna C# pro převod Word na TXT

Aspose.Words for .NET je knihovna pro zpracování dokumentů s bohatými funkcemi, která umožňuje vývojářům pracovat s dokumenty aplikace Word v různých formátech. Poskytuje sadu rozhraní API pro vytváření, manipulaci, konverzi a vykreslování dokumentů. Tuto knihovnu použijeme k extrahování obsahu z dokumentů Wordu jako prostého textu.

Chcete-li nainstalovat knihovnu z NuGet, můžete použít následující příkaz. Nebo si jej můžete stáhnout ze sekce Releases.

PM> Install-Package Aspose.Words 

Kroky k převodu Word DOC na TXT

Můžete extrahovat text z dokumentů aplikace Word a uložit jej ve formátu TXT v několika krocích, protože Aspose.Words for .NET to docela usnadnil. Níže jsou uvedeny kroky, které musíme provést pro převod Wordu na TXT.

  • Načtěte soubor Word DOC/DOCX.
  • Převeďte jej do formátu TXT a uložte soubor na požadované místo.

Nemusíte tedy analyzovat celý dokument aplikace Word a extrahovat text řádek po řádku nebo stránku po stránce. Pojďme nyní napsat kód C# pro extrahování textu z dokumentu aplikace Word.

Převést Word DOC na TXT v C#

Následují kroky k uložení dokumentu Word DOC nebo DOCX jako souboru TXT v C#.

  • Nejprve načtěte Word DOC/DOCX pomocí třídy Document.
  • Poté uložte dokument jako soubor TXT pomocí metody Document.Save(filePath).

Následující fragment kódu C# převede dokument aplikace Word do formátu TXT.

// Načíst soubor aplikace Word
Document doc = new Document("document.docx");

// Uložte dokument jako soubor TXT
doc.Save("doc-to-text.txt");

Použijte bezplatný převodník C# Word to TXT

Můžete získat bezplatnou dočasnou licenci pro převod souborů Word do formátu TXT bez omezení hodnocení.

Prozkoumejte knihovnu C# Word

Můžete navštívit dokumentaci knihovny C# Word a prozkoumat další funkce. V případě jakýchkoli dotazů nás neváhejte kontaktovat prostřednictvím našeho fóra.

Závěr

V tomto příspěvku na blogu jsme prozkoumali, jak převést dokumenty aplikace Word na soubory TXT v C# pomocí Aspose.Words for .NET. Není třeba analyzovat celé dokumenty aplikace Word, jednoduše extrahujte prostý text z dokumentu v několika krocích. Aspose.Words zjednodušuje proces práce s dokumenty Word programově a poskytuje spolehlivé a efektivní řešení pro úlohy převodu dokumentů. Integrace této knihovny do vašich projektů v jazyce C# vám umožní snadno zvládnout zpracování dokumentů a otevře svět možností pro vaše aplikace.

Viz také