PDF'den Metin Çıkarın C#

PDF biçimi, paylaşım ve yazdırma için salt okunur belgeler oluşturmak için yaygın olarak kullanılır. Genellikle, PDF belgeleri metinle birlikte resimler içerir ve bazı durumlarda PDF’leri ayrıştırırken bu resimleri çıkartmanız gerekebilir. Buna uygun olarak, bu makale C# .NET’te programlı olarak PDF’den görüntülerin nasıl çıkarılacağını kapsar.

PDF’den Görüntüleri Çıkarmak için C# .NET API - Ücretsiz İndirme

PDF’den görüntüleri ayıklamak için Aspose.PDF for .NET kullanacağız. Çok çeşitli PDF oluşturma ve işleme özelliklerini uygulamanıza izin veren güçlü bir API’dir. Ayrıca, PDF’yi ayrıştırmanıza ve görüntüleri sorunsuz bir şekilde çıkarmanıza olanak tanır. API’yi indirebilir veya NuGet kullanarak yükleyebilirsiniz.

PM> Install-Package Aspose.PDF

C# ile bir PDF’den Görüntüleri Çıkarma

Aşağıdakiler, C# dilinde bir PDF’den görüntüleri ayıklama adımlarıdır.

  • Belge sınıfını kullanarak belgeyi yükleyin.
  • Document.Pages koleksiyonunu kullanarak PDF belgesinin sayfaları arasında geçiş yapın.
  • Her sayfa için, Page.Resources.Images koleksiyonundaki her XImage öğesine erişin.
  • Her görüntü için bir FileStream nesnesi oluşturun ve onu JPEG, PNG, vb. olarak kaydedin.
  • Son olarak, FileStream’i kapatın.

Aşağıdaki kod örneği, görüntülerin PDF’den nasıl çıkarılacağını gösterir.

// Belgeyi aç
Document pdfDocument = new Document("candy.pdf");

int imageCounter = 1;

// Sayfalar arasında döngü
foreach (var page in pdfDocument.Pages)
{
    // Tüm görüntüler arasında döngü
    foreach (XImage image in page.Resources.Images)
    {
        // Görüntü için dosya akışı oluştur
        FileStream outputImage = new FileStream(String.Format("Page{0}_Image{1}.jpg", page.Number, imageCounter), FileMode.Create);

        // Çıktı görüntüsünü kaydet
        image.Save(outputImage, ImageFormat.Jpeg);

        // Akışı kapat
        outputImage.Close();

        imageCounter++;
    }

    // Sayacı sıfırla
    imageCounter = 1;
}

Ücretsiz Lisans Alın

Aspose.PDF for .NET’i geçici lisans kullanarak değerlendirme sınırlamaları olmaksızın kullanabilirsiniz.

Çözüm

Çeşitli durumlarda PDF dosyalarının ayrıştırılması ve metin veya resimlerin çıkarılması gerekebilir. Bu makalede, C# dilinde programlı olarak PDF dosyalarından görüntülerin nasıl ayıklanacağını öğrendiniz. Belgeleri kullanarak C# PDF API hakkında daha fazlasını keşfedebilirsiniz. Ayrıca, sorularınızı forumumuza gönderebilirsiniz.

Ayrıca bakınız