Extrahera bilder från PDF C#

Om du hittar en lättimplementerad lösning för att extrahera bilder i PDF med C#, kommer den här artikeln att hjälpa dig mycket. Här får du lära dig hur du bearbetar en PDF-fil och extraherar bilder i några enkla steg. Så låt oss börja extrahera bilder från en PDF-fil.

C#-bibliotek för att extrahera bilder i PDF

För att extrahera bilder från en PDF kommer vi att använda Aspose.PDF för .NET. Det är ett kraftfullt bibliotek som låter dig implementera ett brett utbud av PDF-genererings- och manipuleringsfunktioner. Dessutom låter det dig analysera PDF-filen och extrahera bilder sömlöst. Du kan antingen ladda ner biblioteket eller installera det med NuGet.

PM> Install-Package Aspose.PDF

Hur man extraherar bilder från en PDF i C#

Följande är stegen som vi kommer att följa för att extrahera bilder från en PDF-fil.

  • Ladda PDF-filen.
  • Bläddra igenom sidorna i PDF:en.
  • Extrahera bilder en efter en.
  • Spara de extraherade bilderna.

Följande avsnitt visar hur man skriver kod för PDF-bildextraktion i C#.

C# PDF-bildextraktion

Följande är stegen för att extrahera bilder från en PDF i C#.

  • Ladda dokumentet med klassen Document.
  • Bläddra igenom sidorna i PDF-dokumentet med hjälp av samlingen Document.Pages.
  • För varje sida, gå till varje XImage i samlingen Page.Resources.Images.
  • Skapa ett FileStream-objekt för varje bild och spara det som JPEG, PNG, etc.
  • Slutligen, stäng FileStream.

Följande kodexempel visar hur man extraherar bilder från PDF:en.

// Öppna dokumentet
Document pdfDocument = new Document("candy.pdf");

int imageCounter = 1;

// Bläddra igenom sidorna
foreach (var page in pdfDocument.Pages)
{
    // Gå igenom alla bilder
    foreach (XImage image in page.Resources.Images)
    {
        // Skapa filström för bild
        FileStream outputImage = new FileStream(String.Format("Page{0}_Image{1}.jpg", page.Number, imageCounter), FileMode.Create);

        // Spara utdatabild
        image.Save(outputImage, ImageFormat.Jpeg);

        // Stäng strömmen
        outputImage.Close();

        imageCounter++;
    }

    // Återställ räknaren
    imageCounter = 1;
}

Gratis C# PDF-bildextraktionsbibliotek

Du kan få en gratis tillfällig licens och extrahera bilder från PDF-filer utan några begränsningar.

Utforska C# PDF-biblioteket

Du kan utforska mer om C# PDF-biblioteket med hjälp av dokumentationen. Du kan också lägga upp dina frågor på vårt forum.

Slutsats

Att analysera PDF-filerna och extrahera texten eller bilderna kan krävas i olika fall. I den här artikeln har du lärt dig hur du extraherar bilder från PDF-filer programmatiskt i C#. Du kan enkelt använda den medföljande C#-koden för att extrahera PDF-bilder i dina applikationer.

Se även