Podziel stronę HTML

Pliki HTML są zwykle używane do wyświetlania informacji na stronach internetowych lub aplikacjach internetowych. W rzeczywistości jest to tekst znaczników, który umożliwia również formatowanie tekstu. Czasami pliki HTML są dość duże, ponieważ mogą zawierać dużo danych, w tym tekst, obrazy, wykresy, diagramy i wiele innych treści. Może być konieczne podzielenie plików HTML zgodnie z różnymi wymaganiami lub przypadkami użycia. Przyjrzyjmy się, jak podzielić plik HTML na wiele plików przy użyciu języka C#.

HTML Splitter w C# – instalacja API

Aspose.HTML for .NET API obsługuje tworzenie lub manipulowanie stronami internetowymi HTML w aplikacjach opartych na .NET Framework przy użyciu języka programowania C#. Możesz łatwo zainstalować API, pobierając najnowsze pliki DLL z sekcji Downloads lub z galerii NuGet za pomocą następującego polecenia instalacyjnego:

PM> Install-Package Aspose.Html

Podziel stronę HTML na wiele plików w C#

Aspose.HTML for .NET API ma bogaty zestaw funkcji. Pozwala skopiować zawartość załadowanego dokumentu HTML do innego dokumentu HTML. Ponieważ jednak HTML nie jest formatem o stałym układzie i nie ma stron, dopóki nie wydrukujemy go na określonym urządzeniu, takim jak PDF, DOCX itp. Nie możemy więc znaleźć żadnej metody ani właściwości, które mogłyby podzielić zawartość na strony, tak jak inne stałe formaty układu. Dlatego musisz znaleźć odpowiednie miejsce do podziału kodu HTML i odpowiednio zaprojektować logikę podziału.

W tym przykładzie rozważymy przykład, w którym musisz podzielić stronę internetową HTML na podstawie elementów akapitu. Dlatego poniższe kroki pokazują, jak podzielić stronę HTML według akapitu:

  1. Załaduj wejściową stronę HTML
  2. Znajdź wszystkie elementy akapitu w dokumencie HTML za pomocą Selektor zapytań
  3. Utwórz pusty dokument, aby podzielić plik HTML.
  4. Zapisz wyjściowe pliki HTML

Poniższy fragment kodu dodatkowo wyjaśnia, jak podzielić stronę internetową HTML na wiele plików za pomocą C#:

String content = File.ReadAllText(dataDir1 + "Product.html");
// Utwórz instancję dokumentu HTML
var document = new HTMLDocument(content, "");
            
// Podziel stronę HTML na wiele plików
// znajdź wszystkie elementy akapitu w dokumencie za pomocą CSS Selector Query
var elements = document.QuerySelectorAll("p");
for (int i = 0; i < elements.Length; i++)
{
    // utwórz pusty dokument, aby wyeksportować zawartość
    using (var copyTo = new HTMLDocument())
    {
        // dołączyć treść do wcześniej utworzonego dokumentu
        copyTo.DocumentElement.AppendChild(elements[i]);
        // zapisz dokument
        copyTo.Save(dataDir1 + "doc_" + i + ".html", HTMLSaveFormat.HTML);
    }
}

Wniosek

W tym artykule dowiedzieliśmy się o dzieleniu strony internetowej HTML na wiele plików przy użyciu języka C#. Rozważaliśmy przykład podziału pliku na podstawie różnych elementów akapitu. Podobnie możesz zaimprowizować logikę, aby podzielić 5 lub 10 akapitów w każdym pliku wyjściowym. Mogą istnieć różne inne przypadki użycia podziału strony HTML zgodnie z Twoimi wymaganiami. Jeśli potrzebujesz pomocy w jakimkolwiek innym przypadku użycia lub scenariuszu, napisz do nas na Free Support Forum. Będziemy zaszczyceni mogąc Ci pomóc!

Zobacz też