Extrahujte obrázky z PDF C#

Pokud hledáte snadno implementovatelné řešení pro extrahování obrázků v PDF pomocí C#, tento článek vám hodně pomůže. Zde se dozvíte, jak zpracovat soubor PDF a extrahovat obrázky v několika jednoduchých krocích. Začněme tedy extrahovat obrázky ze souboru PDF.

Knihovna C# pro extrahování obrázků v PDF

K extrahování obrázků z PDF použijeme Aspose.PDF for .NET. Je to výkonná knihovna, která vám umožní implementovat širokou škálu funkcí pro generování PDF a manipulaci. Kromě toho vám umožňuje analyzovat PDF a bez problémů extrahovat obrázky. Knihovnu si můžete buď stáhnout, nebo ji nainstalovat pomocí NuGet.

PM> Install-Package Aspose.PDF

Jak extrahovat obrázky z PDF v C#

Níže jsou uvedeny kroky, které budeme dodržovat při extrahování obrázků ze souboru PDF.

  • Načtěte soubor PDF.
  • Procházejte stránky v PDF.
  • Extrahujte obrázky jeden po druhém.
  • Uložte extrahované obrázky.

Následující část ukazuje, jak napsat kód pro extrakci obrázků PDF v C#.

C# extrakce PDF obrázků

Níže jsou uvedeny kroky k extrahování obrázků z PDF v C#.

  • Načtěte dokument pomocí třídy Document.
  • Procházejte stránky dokumentu PDF pomocí kolekce Document.Pages.
  • Pro každou stránku otevřete každý XImage v kolekci Page.Resources.Images.
  • Vytvořte pro každý obrázek objekt FileStream a uložte jej jako JPEG, PNG atd.
  • Nakonec FileStream zavřete.

Následující ukázka kódu ukazuje, jak extrahovat obrázky z PDF.

// Otevřete dokument
Document pdfDocument = new Document("candy.pdf");

int imageCounter = 1;

// Procházet stránky
foreach (var page in pdfDocument.Pages)
{
    // Projděte všechny obrázky
    foreach (XImage image in page.Resources.Images)
    {
        // Vytvořte souborový proud pro obrázek
        FileStream outputImage = new FileStream(String.Format("Page{0}_Image{1}.jpg", page.Number, imageCounter), FileMode.Create);

        // Uložit výstupní obrázek
        image.Save(outputImage, ImageFormat.Jpeg);

        // Zavřít stream
        outputImage.Close();

        imageCounter++;
    }

    // Vynulovat počítadlo
    imageCounter = 1;
}

Bezplatná knihovna extrakce obrázků C# PDF

Můžete získat bezplatnou dočasnou licenci a extrahovat obrázky ze souborů PDF bez jakýchkoli omezení.

Prozkoumejte knihovnu C# PDF

Více o knihovně C# PDF můžete prozkoumat pomocí dokumentace. Své dotazy můžete také zveřejňovat na našem fóru.

Závěr

V různých případech může být vyžadována analýza souborů PDF a extrahování textu nebo obrázků. V tomto článku jste se naučili, jak extrahovat obrázky ze souborů PDF programově v C#. Dodaný kód C# můžete snadno použít pro extrakci obrázků PDF ve svých aplikacích.

Viz také