Rozdělit HTML webovou stránku

Soubory HTML se obvykle používají k zobrazení informací na webových stránkách nebo webových aplikacích. Je to vlastně značkovací text, který vám také umožňuje formátovat text. Někdy jsou soubory HTML poměrně velké, protože mohou obsahovat mnoho dat včetně textu, obrázků, grafů, diagramů a mnoha dalšího obsahu. Možná budete muset rozdělit soubory HTML podle různých požadavků nebo případů použití. Pojďme prozkoumat, jak rozdělit soubor HTML do více souborů pomocí C#.

HTML Splitter v C# – Instalace API

Aspose.HTML for .NET API podporuje vytváření nebo manipulaci s webovými stránkami HTML ve vašich aplikacích založených na .NET Framework pomocí programovacího jazyka C#. Rozhraní API můžete snadno nainstalovat stažením nejnovějších souborů DLL ze sekce Downloads nebo prostřednictvím galerie NuGet pomocí následujícího instalačního příkazu:

PM> Install-Package Aspose.Html

Rozdělit HTML webovou stránku do více souborů v C#

Aspose.HTML for .NET API má bohatou sadu funkcí. Umožňuje zkopírovat obsah načteného HTML dokumentu do jiného HTML dokumentu. Protože však HTML není formát s pevným rozložením a nemá stránky, dokud jej nevytiskneme na konkrétní zařízení, jako je PDF, DOCX atd. Nemůžeme tedy najít žádnou metodu nebo vlastnost, která by dokázala rozdělit obsah na stránky jako jiné pevné- formáty rozložení. Proto musíte najít správné místo pro rozdělení HTML a podle toho navrhnout logiku rozdělení.

V tomto příkladu budeme zvažovat příklad, kdy potřebujete rozdělit webovou stránku HTML na základě prvků odstavce. Následující kroky proto ukazují, jak rozdělit webovou stránku HTML podle odstavce:

  1. Načíst vstupní HTML webovou stránku
  2. Najděte všechny prvky odstavce v dokumentu HTML pomocí Výběr dotazů
  3. Vytvořte prázdný dokument pro rozdělení HTML souboru
  4. Uložit výstupní HTML soubory

Níže uvedený fragment kódu dále vysvětluje, jak rozdělit webovou stránku HTML do více souborů pomocí C#:

String content = File.ReadAllText(dataDir1 + "Product.html");
// Vytvořte instanci dokumentu HTML
var document = new HTMLDocument(content, "");
            
// Rozdělit HTML webovou stránku do více souborů
// najít všechny prvky odstavce v dokumentu pomocí dotazu selektoru CSS
var elements = document.QuerySelectorAll("p");
for (int i = 0; i < elements.Length; i++)
{
    // vytvořte prázdný dokument pro export obsahu
    using (var copyTo = new HTMLDocument())
    {
        // připojit obsah do dříve vytvořeného dokumentu
        copyTo.DocumentElement.AppendChild(elements[i]);
        // uložit dokument
        copyTo.Save(dataDir1 + "doc_" + i + ".html", HTMLSaveFormat.HTML);
    }
}

Závěr

V tomto článku jsme se dozvěděli o rozdělení webové stránky HTML do více souborů pomocí C#. Zvažovali jsme příklad rozdělení souboru na základě různých prvků odstavce. Podobně můžete improvizovat logiku k rozdělení 5 nebo 10 odstavců v každém výstupním souboru. Mohou existovat různé další případy použití pro rozdělení webové stránky HTML podle vašich požadavků. Neváhejte nám napsat na Free Support Forum, pokud potřebujete pomoc s jakýmkoli jiným případem použití nebo scénářem. Bude nám ctí vám pomoci!

Viz také