Vývojáři .NET nyní mohou vyvinout hromadný stahovač obrázků pro obchodní software. Aspose.HTML for .NET je správná služba extrakce obrázků, která nabízí obrovské množství tříd a metod pro programové extrahování obrázků z webu. Kromě toho neexistuje žádný složitý systém echo pro použití této knihovny C# a obrázky si můžete snadno stáhnout z webových stránek v C#. Kromě toho můžete pomocí tohoto Aspose.HTML for .NET extrahovat grafická i textová data, jejíž implementaci můžete vidět zde. Začněme tedy tento blogový příspěvek bez dalšího slova.
V této příručce se budeme zabývat následujícími částmi:
Instalace služby extrakce obrazu
Takže můžete analyzovat HTML stránky programově instalací tohoto C# API. Kromě extrakce dat vám také umožňuje převádět HTML stránky do jiných oblíbených formátů souborů. Proto mějte na svém počítači nainstalovaný .NET, nainstalujte tuto službu extrakce obrazu stažením souboru DLL nebo můžete použít následující příkaz do NuGet Správce balíčků:
PM> Install-Package Aspose.Html
Proces instalace je velmi jednoduchý, i když pokud narazíte na nějaké potíže, můžete navštívit pokyny k instalaci zde.
Stáhněte si obrázky z webu v C# - ukázka kódu
Nyní můžeme implementovat funkcionalitu pro extrahování obrázků z webu programově.
Následující kroky ukazují, jak stahovat obrázky z webu v C#:
- Otevřete webovou stránku, ze které chcete extrahovat obrázky, inicializací objektu třídy HTMLDocument.
- Shromážděte všechny prvky “img” voláním metody GetElementsByTagName.
- Voláním metody Select vytvořte samostatnou kolekci relativních adres URL obrázků a vytvořte absolutní adresy URL obrázků.
- Projděte všechny absolutní adresy URL obrázků.
- Vytvořte zprávu s žádostí o obrázek inicializací objektu třídy RequestMessage.
- Extrahujte obrázky voláním metody Context.Network.Send(request).
- Zkontrolujte, zda je odpověď úspěšná, a uložte obrázek do místního systému souborů voláním metody WriteAllBytes.
Následující ukázka kódu ukazuje, jak programově vyvinout hromadné stahování obrázků:
using Aspose.Html;
using Aspose.Html.Net;
namespace AsposeHTML
{
class HTML
{
// Stáhněte si obrázky z webu pomocí služby extrakce obrázků
static void Main(string[] args)
{
// Definujte cestu k pracovnímu adresáři.
String dataDir = "/files/";
// Otevřete webovou stránku, ze které chcete extrahovat obrázky, inicializací objektu třídy HTMLDocument.
using var document = new HTMLDocument("https://blog.aspose.com/cs/tex/latex-mathematical-expressions-using-latex-to-image-api/");
// Sbírejte všechny<img> prvků voláním metody GetElementsByTagName.
var images = document.GetElementsByTagName("img");
// Voláním metody Select vytvořte samostatnou kolekci relativních adres URL obrázků a vytvořte absolutní adresy URL obrázků.
var urls = images.Select(element => element.GetAttribute("src")).Distinct();
var absUrls = urls.Select(src => new Url(src, document.BaseURI));
// Projděte všechny absolutní adresy URL obrázků.
foreach (var url in absUrls)
{
// Vytvořte zprávu s žádostí o obrázek inicializací objektu třídy RequestMessage.
using var request = new RequestMessage(url);
// Extrahujte obrázky voláním metody Context.Network.Send(request).
using var response = document.Context.Network.Send(request);
// Zkontrolujte, zda je odpověď úspěšná, a uložte obrázek do místního systému souborů voláním metody WriteAllBytes.
if (response.IsSuccess)
{
File.WriteAllBytes(Path.Combine(dataDir, url.Pathname.Split('/').Last()), response.Content.ReadAsByteArray());
}
}
}
}
}
Výstup můžete vidět na obrázku níže:
Online extraktor dat
Existuje online nástroj poháněný Aspose.HTML. Tento online extraktor dat na podnikové úrovni je však vybaven uživatelsky přívětivým uživatelským rozhraním a extrakci dat můžete provádět jedním kliknutím. Navíc je webový a nevyžaduje vytvoření účtu. Stačí tedy otevřít tento nástroj ve webovém prohlížeči a zahájit extrakci důležitých dat. Ve skutečnosti budou do tohoto online nástroje v blízké budoucnosti přidány další funkce.
Extrahujte obrázky z webu – získejte bezplatnou licenci
Můžete získat bezplatnou dočasnou licenci k vyzkoušení této [služby] extrakce obrázků]1 bez omezení hodnocení.
Závěr
Zde končíme tento blogový příspěvek a doufáme, že jste se naučili stahovat obrázky z webu v C# programově. Dále jsme také prošli kroky a úryvkem kódu k vývoji hromadného stahování obrázků. Navíc můžete extrahovat obrázky z webu napsáním několika řádků kódu v C# pomocí Aspose.HTML for .NET. Můžete tedy najít komplexní dokumentaci týkající se použití a vývoje. Navíc API odkazy poskytne výchozí bod pro vývojáře .NET.
Zůstaňte v kontaktu s aspose.com ohledně nadcházejících blogových příspěvků.
Nápověda je k dispozici
Své dotazy nebo dotazy můžete sdílet na našem fóru.
Často kladené otázky – FAQ
Jak stáhnu obrázek z adresy URL?
Obrázky si můžete stáhnout z webu v C# pomocí Aspose.HTML for .NET. Dále prosím navštivte tento odkaz, kde se dozvíte, jak dosáhnout této funkce pomocí této služby extrakce obrázků.
Jak extrahovat data online?
Tento online extraktor dat umožňuje robustně a efektivně extrahovat textová a grafická data z webových stránek.