V oblasti zpracování dokumentů často vyvstává potřeba převádět dokumenty Wordu do jednodušších formátů prostého textu. Ať už jde o extrakci dat, analýzu obsahu nebo z důvodů kompatibility, schopnost převádět soubory Wordu (.doc, .docx) na prostý text (.txt) je pro vývojáře cennou dovedností. V tomto příspěvku na blogu prozkoumáme, jak převést dokument aplikace Word do formátu TXT v aplikaci C#.
Knihovna C# pro převod Word na TXT
Aspose.Words for .NET je knihovna pro zpracování dokumentů s bohatými funkcemi, která umožňuje vývojářům pracovat s dokumenty aplikace Word v různých formátech. Poskytuje sadu rozhraní API pro vytváření, manipulaci, konverzi a vykreslování dokumentů. Tuto knihovnu použijeme k extrahování obsahu z dokumentů Wordu jako prostého textu.
Chcete-li nainstalovat knihovnu z NuGet, můžete použít následující příkaz. Nebo si jej můžete stáhnout ze sekce Releases.
PM> Install-Package Aspose.Words
Kroky k převodu Word DOC na TXT
Můžete extrahovat text z dokumentů aplikace Word a uložit jej ve formátu TXT v několika krocích, protože Aspose.Words for .NET to docela usnadnil. Níže jsou uvedeny kroky, které musíme provést pro převod Wordu na TXT.
- Načtěte soubor Word DOC/DOCX.
- Převeďte jej do formátu TXT a uložte soubor na požadované místo.
Nemusíte tedy analyzovat celý dokument aplikace Word a extrahovat text řádek po řádku nebo stránku po stránce. Pojďme nyní napsat kód C# pro extrahování textu z dokumentu aplikace Word.
Převést Word DOC na TXT v C#
Následují kroky k uložení dokumentu Word DOC nebo DOCX jako souboru TXT v C#.
- Nejprve načtěte Word DOC/DOCX pomocí třídy Document.
- Poté uložte dokument jako soubor TXT pomocí metody Document.Save(filePath).
Následující fragment kódu C# převede dokument aplikace Word do formátu TXT.
// Načíst soubor aplikace Word
Document doc = new Document("document.docx");
// Uložte dokument jako soubor TXT
doc.Save("doc-to-text.txt");
Použijte bezplatný převodník C# Word to TXT
Můžete získat bezplatnou dočasnou licenci pro převod souborů Word do formátu TXT bez omezení hodnocení.
Prozkoumejte knihovnu C# Word
Můžete navštívit dokumentaci knihovny C# Word a prozkoumat další funkce. V případě jakýchkoli dotazů nás neváhejte kontaktovat prostřednictvím našeho fóra.
Závěr
V tomto příspěvku na blogu jsme prozkoumali, jak převést dokumenty aplikace Word na soubory TXT v C# pomocí Aspose.Words for .NET. Není třeba analyzovat celé dokumenty aplikace Word, jednoduše extrahujte prostý text z dokumentu v několika krocích. Aspose.Words zjednodušuje proces práce s dokumenty Word programově a poskytuje spolehlivé a efektivní řešení pro úlohy převodu dokumentů. Integrace této knihovny do vašich projektů v jazyce C# vám umožní snadno zvládnout zpracování dokumentů a otevře svět možností pro vaše aplikace.