Inom dokumentbehandlingsområdet uppstår ofta behovet av att konvertera Word-dokument till enklare oformaterad text. Oavsett om det är av dataextraktion, innehållsanalys eller kompatibilitetsskäl, är möjligheten att konvertera Word-filer (.doc, .docx) till vanlig text (.txt) en värdefull färdighet för utvecklare. I det här blogginlägget kommer vi att utforska hur man konverterar ett Word-dokument till TXT-format i en C#-applikation.
- C# Word till TXT Converter
- Steg för att konvertera DOC till TXT i C#
- C#-kod för att konvertera Word-fil till TXT
C#-bibliotek för konvertering av Word till TXT
Aspose.Words for .NET är ett funktionsrikt dokumentbehandlingsbibliotek som gör det möjligt för utvecklare att arbeta med Word-dokument i olika format. Det tillhandahåller en uppsättning API:er för skapande, manipulering, konvertering och rendering av dokument. Vi kommer att använda det här biblioteket för att extrahera innehåll från Word-dokument som vanlig text.
För att installera biblioteket från NuGet, kan du använda följande kommando. Eller så kan du ladda ner den från avsnittet Releases.
PM> Install-Package Aspose.Words
Steg för att konvertera Word DOC till TXT
Du kan extrahera text från Word-dokument och spara den i TXT-format i ett par steg, eftersom Aspose.Words för .NET har gjort det ganska enkelt. Nedan är stegen vi behöver utföra för konvertering av Word till TXT.
- Ladda Word DOC/DOCX-filen.
- Konvertera den till TXT-format och spara filen på önskad plats.
Så du behöver inte analysera hela Word-dokumentet och extrahera text rad för rad eller sida för sida. Låt oss nu skriva C#-koden för att extrahera text från ett Word-dokument.
Konvertera ett Word DOC till TXT i C#
Följande är stegen för att spara ett Word DOC- eller DOCX-dokument som en TXT-fil i C#.
- Ladda först Word DOC/DOCX med klassen Document.
- Spara sedan dokumentet som en TXT-fil med metoden Document.Save(filPath).
Följande C#-kodavsnitt konverterar ett Word-dokument till TXT-format.
// Ladda Word-fil
Document doc = new Document("document.docx");
// Spara dokument som TXT-fil
doc.Save("doc-to-text.txt");
Använd gratis C# Word to TXT Converter
Du kan få en gratis temporär licens för att konvertera Word-filer till TXT-format utan utvärderingsbegränsningar.
Utforska C# Word Library
Du kan besöka dokumentationen i C# Word-biblioteket för att utforska andra funktioner. Om du har några frågor är du välkommen att meddela oss via vårt forum.
Slutsats
I det här blogginlägget har vi utforskat hur man konverterar Word-dokument till TXT-filer i C# med Aspose.Words för .NET. Inget behov av att analysera hela Word-dokument, extrahera helt enkelt den vanliga texten från ett dokument i ett par steg. Aspose.Words förenklar processen att arbeta med Word-dokument programmatiskt, vilket ger en pålitlig och effektiv lösning för dokumentkonverteringsuppgifter. Genom att integrera detta bibliotek i dina C#-projekt kan du hantera dokumentbehandling med lätthet, vilket öppnar upp en värld av möjligheter för dina applikationer.