Extrahujte obrázky z PDF C#

Pokud hledáte snadno implementovatelné řešení pro extrahování obrázků v PDF pomocí C#, tento článek vám hodně pomůže. Zde se dozvíte, jak zpracovat soubor PDF a extrahovat obrázky v několika jednoduchých krocích. Začněme tedy extrahovat obrázky ze souboru PDF.

Knihovna C# pro extrahování obrázků v PDF

K extrahování obrázků z PDF použijeme Aspose.PDF for .NET. Je to výkonná knihovna, která vám umožní implementovat širokou škálu funkcí pro generování PDF a manipulaci. Kromě toho vám umožňuje analyzovat PDF a bez problémů extrahovat obrázky. Knihovnu si můžete buď stáhnout, nebo ji nainstalovat pomocí NuGet.

PM> Install-Package Aspose.PDF

Jak extrahovat obrázky z PDF v C#

Níže jsou uvedeny kroky, které budeme dodržovat při extrahování obrázků ze souboru PDF.

 • Načtěte soubor PDF.
 • Procházejte stránky v PDF.
 • Extrahujte obrázky jeden po druhém.
 • Uložte extrahované obrázky.

Následující část ukazuje, jak napsat kód pro extrakci obrázků PDF v C#.

C# extrakce PDF obrázků

Níže jsou uvedeny kroky k extrahování obrázků z PDF v C#.

 • Načtěte dokument pomocí třídy Document.
 • Procházejte stránky dokumentu PDF pomocí kolekce Document.Pages.
 • Pro každou stránku otevřete každý XImage v kolekci Page.Resources.Images.
 • Vytvořte pro každý obrázek objekt FileStream a uložte jej jako JPEG, PNG atd.
 • Nakonec FileStream zavřete.

Následující ukázka kódu ukazuje, jak extrahovat obrázky z PDF.

// Otevřete dokument
Document pdfDocument = new Document("candy.pdf");

int imageCounter = 1;

// Procházet stránky
foreach (var page in pdfDocument.Pages)
{
  // Projděte všechny obrázky
  foreach (XImage image in page.Resources.Images)
  {
    // Vytvořte souborový proud pro obrázek
    FileStream outputImage = new FileStream(String.Format("Page{0}_Image{1}.jpg", page.Number, imageCounter), FileMode.Create);

    // Uložit výstupní obrázek
    image.Save(outputImage, ImageFormat.Jpeg);

    // Zavřít stream
    outputImage.Close();

    imageCounter++;
  }

  // Vynulovat počítadlo
  imageCounter = 1;
}

Bezplatná knihovna extrakce obrázků C# PDF

Můžete získat bezplatnou dočasnou licenci a extrahovat obrázky ze souborů PDF bez jakýchkoli omezení.

Prozkoumejte knihovnu C# PDF

Více o knihovně C# PDF můžete prozkoumat pomocí dokumentace. Své dotazy můžete také zveřejňovat na našem fóru.

Závěr

V různých případech může být vyžadována analýza souborů PDF a extrahování textu nebo obrázků. V tomto článku jste se naučili, jak extrahovat obrázky ze souborů PDF programově v C#. Dodaný kód C# můžete snadno použít pro extrakci obrázků PDF ve svých aplikacích.

Viz také