C#'ta PDF'yi TXT'ye dönüştürün

Bir programcı olarak, analiz ve bilgi çıkarma gibi daha ileri işlemler için genellikle PDF dosyalarından içeriği düz metin olarak çıkarmak zorunda kalırsınız. PDF dosyalarını işlemek ve PDF’nin tamamını TXT formatına dönüştürmek, doğru araçlara sahip olmadığınızda zahmetli bir iştir. Bu blogda, C# dilinde bir PDF dosyasını programlı olarak TXT formatına nasıl dönüştürebileceğimizi araştıracağız.

PDF’den TXT’ye Dönüştürme için C# Kitaplığı

Aspose.Words for .NET, geliştiricilerin Word belgelerinin yanı sıra PDF dahil çeşitli diğer formatlarla çalışmasına olanak tanıyan harika bir belge işleme API’sidir. Aspose.Words, kapsamlı özellikleriyle belge düzenleme, dönüştürme ve oluşturma görevlerini basitleştirir. Bu kütüphaneyi bir .NET uygulamasında PDF dosyalarını TXT formatına dönüştürmek için kullanacağız.

Aşağıdaki komutu kullanarak kitaplığı NuGet’ten yükleyebilirsiniz. Veya DLL’sini Sürümler bölümünden indirin.

PM> Install-Package Aspose.Words 

C#’ta PDF’yi TXT’ye dönüştürme

Aspose.Words for .NET, PDF dosyalarından metin çıkarmanın tüm karmaşık işlemlerini gizler ve aşağıda belirtildiği gibi PDF’den TXT’ye dönüştürmeyi birkaç adımda gerçekleştirmenize olanak tanır.

  • PDF dosyasını yükleyin.
  • Tek bir işlev çağrısıyla PDF’yi TXT formatına dönüştürün.

Böylece, kaynak PDF ne kadar büyük olursa olsun, birkaç satır kodla PDF dosyasındaki içeriği düz metne dönüştürebilirsiniz. Şimdi bu dönüşümü C# dilinde gerçekleştirecek kodu yazalım.

  • Öncelikle Document sınıfını kullanarak PDF’yi yükleyin.
  • Daha sonra Document.Save(filePath) yöntemini kullanarak belgeyi TXT dosyası olarak kaydedin.

Aşağıdaki C# kod parçacığı, PDF’yi TXT biçimine dönüştürür.

// PDF dosyasını yükle
Document pdf = new Document("document.pdf");

// PDF'yi TXT olarak kaydet
pdf.Save("pdf.txt", SaveFormat.Text);

Ücretsiz API Lisansı Alın

Değerlendirme sınırlamaları olmadan PDF dosyalarını TXT formatına dönüştürmek için ücretsiz geçici lisans alabilirsiniz.

Çözüm

Bu blog yazısında Aspose.Words for .NET kütüphanesini kullanarak PDF’yi C#’ta TXT’ye nasıl dönüştürebileceğimizi araştırdık. Yönergeleri takip ederek ve kod pasajını kullanarak büyük PDF dosyalarını kolayca işleyebilir ve bunları düz metne dönüştürebilirsiniz. Aspose.Words, belge işleme görevlerini basitleştirerek, uygulamalarında çeşitli belge formatlarıyla çalışan geliştiriciler için onu değerli bir araç haline getirir. Harika özelliklerini keşfetmek için bu .NET kelime işlem kütüphanesinin belgelerini ziyaret edebilirsiniz. Herhangi bir sorunuz olursa, forum aracılığıyla bize bildirmekten çekinmeyin.

Ayrıca bakınız