Konvertera Word DOC till TXT i C#

Inom dokumentbehandlingsområdet uppstår ofta behovet av att konvertera Word-dokument till enklare oformaterad text. Oavsett om det är av dataextraktion, innehållsanalys eller kompatibilitetsskäl, är möjligheten att konvertera Word-filer (.doc, .docx) till vanlig text (.txt) en värdefull färdighet för utvecklare. I det här blogginlägget kommer vi att utforska hur man konverterar ett Word-dokument till TXT-format i en C#-applikation.

C#-bibliotek för konvertering av Word till TXT

Aspose.Words for .NET är ett funktionsrikt dokumentbehandlingsbibliotek som gör det möjligt för utvecklare att arbeta med Word-dokument i olika format. Det tillhandahåller en uppsättning API:er för skapande, manipulering, konvertering och rendering av dokument. Vi kommer att använda det här biblioteket för att extrahera innehåll från Word-dokument som vanlig text.

För att installera biblioteket från NuGet, kan du använda följande kommando. Eller så kan du ladda ner den från avsnittet Releases.

PM> Install-Package Aspose.Words 

Steg för att konvertera Word DOC till TXT

Du kan extrahera text från Word-dokument och spara den i TXT-format i ett par steg, eftersom Aspose.Words för .NET har gjort det ganska enkelt. Nedan är stegen vi behöver utföra för konvertering av Word till TXT.

  • Ladda Word DOC/DOCX-filen.
  • Konvertera den till TXT-format och spara filen på önskad plats.

Så du behöver inte analysera hela Word-dokumentet och extrahera text rad för rad eller sida för sida. Låt oss nu skriva C#-koden för att extrahera text från ett Word-dokument.

Konvertera ett Word DOC till TXT i C#

Följande är stegen för att spara ett Word DOC- eller DOCX-dokument som en TXT-fil i C#.

  • Ladda först Word DOC/DOCX med klassen Document.
  • Spara sedan dokumentet som en TXT-fil med metoden Document.Save(filPath).

Följande C#-kodavsnitt konverterar ett Word-dokument till TXT-format.

// Ladda Word-fil
Document doc = new Document("document.docx");

// Spara dokument som TXT-fil
doc.Save("doc-to-text.txt");

Använd gratis C# Word to TXT Converter

Du kan få en gratis temporär licens för att konvertera Word-filer till TXT-format utan utvärderingsbegränsningar.

Utforska C# Word Library

Du kan besöka dokumentationen i C# Word-biblioteket för att utforska andra funktioner. Om du har några frågor är du välkommen att meddela oss via vårt forum.

Slutsats

I det här blogginlägget har vi utforskat hur man konverterar Word-dokument till TXT-filer i C# med Aspose.Words för .NET. Inget behov av att analysera hela Word-dokument, extrahera helt enkelt den vanliga texten från ett dokument i ett par steg. Aspose.Words förenklar processen att arbeta med Word-dokument programmatiskt, vilket ger en pålitlig och effektiv lösning för dokumentkonverteringsuppgifter. Genom att integrera detta bibliotek i dina C#-projekt kan du hantera dokumentbehandling med lätthet, vilket öppnar upp en värld av möjligheter för dina applikationer.

Se även