Pokud hledáte snadno implementovatelné řešení pro extrahování obrázků v PDF pomocí C#, tento článek vám hodně pomůže. Zde se dozvíte, jak zpracovat soubor PDF a extrahovat obrázky v několika jednoduchých krocích. Začněme tedy extrahovat obrázky ze souboru PDF.
Knihovna C# pro extrahování obrázků v PDF
K extrahování obrázků z PDF použijeme Aspose.PDF for .NET. Je to výkonná knihovna, která vám umožní implementovat širokou škálu funkcí pro generování PDF a manipulaci. Kromě toho vám umožňuje analyzovat PDF a bez problémů extrahovat obrázky. Knihovnu si můžete buď stáhnout, nebo ji nainstalovat pomocí NuGet.
PM> Install-Package Aspose.PDF
Jak extrahovat obrázky z PDF v C#
Níže jsou uvedeny kroky, které budeme dodržovat při extrahování obrázků ze souboru PDF.
- Načtěte soubor PDF.
- Procházejte stránky v PDF.
- Extrahujte obrázky jeden po druhém.
- Uložte extrahované obrázky.
Následující část ukazuje, jak napsat kód pro extrakci obrázků PDF v C#.
C# extrakce PDF obrázků
Níže jsou uvedeny kroky k extrahování obrázků z PDF v C#.
- Načtěte dokument pomocí třídy Document.
- Procházejte stránky dokumentu PDF pomocí kolekce Document.Pages.
- Pro každou stránku otevřete každý XImage v kolekci Page.Resources.Images.
- Vytvořte pro každý obrázek objekt FileStream a uložte jej jako JPEG, PNG atd.
- Nakonec FileStream zavřete.
Následující ukázka kódu ukazuje, jak extrahovat obrázky z PDF.
// Otevřete dokument
Document pdfDocument = new Document("candy.pdf");
int imageCounter = 1;
// Procházet stránky
foreach (var page in pdfDocument.Pages)
{
// Projděte všechny obrázky
foreach (XImage image in page.Resources.Images)
{
// Vytvořte souborový proud pro obrázek
FileStream outputImage = new FileStream(String.Format("Page{0}_Image{1}.jpg", page.Number, imageCounter), FileMode.Create);
// Uložit výstupní obrázek
image.Save(outputImage, ImageFormat.Jpeg);
// Zavřít stream
outputImage.Close();
imageCounter++;
}
// Vynulovat počítadlo
imageCounter = 1;
}
Bezplatná knihovna extrakce obrázků C# PDF
Můžete získat bezplatnou dočasnou licenci a extrahovat obrázky ze souborů PDF bez jakýchkoli omezení.
Prozkoumejte knihovnu C# PDF
Více o knihovně C# PDF můžete prozkoumat pomocí dokumentace. Své dotazy můžete také zveřejňovat na našem fóru.
Závěr
V různých případech může být vyžadována analýza souborů PDF a extrahování textu nebo obrázků. V tomto článku jste se naučili, jak extrahovat obrázky ze souborů PDF programově v C#. Dodaný kód C# můžete snadno použít pro extrakci obrázků PDF ve svých aplikacích.