Konvertera PDF till TXT i C#

Som programmerare måste du ofta extrahera innehåll från PDF-filer som vanlig text för vidare bearbetning, såsom analys och informationsextraktion. Att bearbeta PDF-filer och konvertera en hel PDF till TXT-format är en besvärlig uppgift när du inte har rätt verktyg. Så i den här bloggen kommer vi att utforska hur man konverterar en PDF-fil till TXT-format programmatiskt i C#.

C#-bibliotek för PDF till TXT-konvertering

Aspose.Words for .NET är ett fantastiskt dokumentbearbetnings-API som låter utvecklare arbeta med Word-dokument, såväl som olika andra format, inklusive PDF. Med sin omfattande uppsättning funktioner förenklar Aspose.Words dokumentmanipulering, konvertering och genereringsuppgifter. Vi kommer att använda detta bibliotek för att konvertera PDF-filer till TXT-format i en .NET-applikation.

Du kan installera biblioteket från NuGet med följande kommando. Eller ladda ner dess DLL från avsnittet Releases.

PM> Install-Package Aspose.Words 

Konvertera en PDF till TXT i C#

Aspose.Words för .NET döljer alla komplexa operationer för att extrahera text från PDF-filer och gör att du kan utföra PDF till TXT-konvertering i ett par steg, som nämns nedan.

  • Ladda PDF-filen.
  • Konvertera PDF till TXT-format med ett enda funktionsanrop.

Med ett par rader kod kan du alltså konvertera innehåll i en PDF-fil till vanlig text, oavsett hur stor käll-PDF-filen är. Låt oss nu skriva koden för att utföra denna konvertering i C#.

  • Ladda först PDF:en med klassen Document.
  • Spara sedan dokumentet som en TXT-fil med metoden Document.Save(filePath).

Följande C#-kodavsnitt konverterar en PDF till TXT-format.

// Ladda PDF-fil
Document pdf = new Document("document.pdf");

// Spara PDF som TXT
pdf.Save("pdf.txt", SaveFormat.Text);

Skaffa en gratis API-licens

Du kan få en gratis temporär licens för att konvertera PDF-filer till TXT-format utan utvärderingsbegränsningar.

Slutsats

I det här blogginlägget undersökte vi hur man konverterar PDF till TXT i C# med hjälp av Aspose.Words for .NET-biblioteket. Genom att följa riktlinjerna och använda kodavsnittet kan du enkelt bearbeta stora PDF-filer och konvertera dem till vanlig text. Aspose.Words förenklar dokumentbearbetningsuppgifter, vilket gör det till ett värdefullt verktyg för utvecklare som arbetar med olika dokumentformat i sina applikationer. Du kan besöka dokumentationen för detta .NET-ordbehandlingsbibliotek för att utforska dess fantastiska funktioner. Om du har några frågor är du välkommen att meddela oss via vårt forum.

Se även