Розділена веб-сторінка HTML

Файли HTML зазвичай використовуються для відображення інформації на веб-сайтах або в веб-додатках. Насправді це текст розмітки, який також дозволяє форматувати текст. Іноді файли HTML досить великі, оскільки вони можуть містити багато даних, включаючи текст, зображення, діаграми та багато іншого вмісту. Вам може знадобитися розділити файли HTML відповідно до різних вимог або варіантів використання. Давайте дослідимо, як розділити файл HTML на кілька файлів за допомогою C#.

HTML Splitter у C# – встановлення API

Aspose.HTML for .NET API підтримує створення або керування веб-сторінками HTML у ваших програмах на основі .NET Framework за допомогою мови програмування C#. Ви можете легко інсталювати API, завантаживши найновіші файли DLL із розділу Завантаження або через галерею NuGet за допомогою такої команди встановлення:

PM> Install-Package Aspose.Html

Розділити веб-сторінку HTML на кілька файлів у C#

API Aspose.HTML for .NET має багатий набір функцій. Це дозволяє копіювати вміст завантаженого документа HTML в інший документ HTML. Однак, оскільки HTML не є форматом із фіксованим макетом і не має сторінок, доки ми не надрукуємо його на певному пристрої, як-от PDF, DOCX тощо. Таким чином, ми не можемо знайти метод чи властивість, які можуть розділити вміст на сторінки, як інші фіксовані- формати макета. Тому вам потрібно знайти відповідне місце для розділення HTML і відповідно розробити логіку поділу.

У цьому прикладі ми розглянемо приклад, коли вам потрібно розділити веб-сторінку HTML на основі елементів абзаців. Таким чином, наступні кроки показують, як розділити веб-сторінку HTML на абзац:

  1. Завантажити веб-сторінку введення HTML
  2. Знайти всі елементи абзацу в документі HTML за допомогою Query Selector
  3. Створіть порожній документ, щоб розділити файл HTML.
  4. Збережіть вихідні файли HTML

Наведений нижче фрагмент коду докладніше пояснює, як розділити веб-сторінку HTML на кілька файлів за допомогою C#:

String content = File.ReadAllText(dataDir1 + "Product.html");
// Створіть екземпляр документа HTML
var document = new HTMLDocument(content, "");
            
// Розділіть веб-сторінку HTML на кілька файлів
// знайти всі елементи абзацу всередині документа за допомогою запиту CSS Selector
var elements = document.QuerySelectorAll("p");
for (int i = 0; i < elements.Length; i++)
{
    // створити порожній документ для експорту вмісту
    using (var copyTo = new HTMLDocument())
    {
        // додати вміст до раніше створеного документа
        copyTo.DocumentElement.AppendChild(elements[i]);
        // зберегти документ
        copyTo.Save(dataDir1 + "doc_" + i + ".html", HTMLSaveFormat.HTML);
    }
}

Висновок

У цій статті ми дізналися про розділення веб-сторінки HTML на кілька файлів за допомогою C#. Ми розглянули приклад розбиття файлу на основі різних елементів абзацу. Так само ви можете імпровізувати логіку, щоб розділити 5 або 10 абзаців у кожному вихідному файлі. Можуть бути інші випадки використання для розділення веб-сторінки HTML відповідно до ваших вимог. Будь ласка, напишіть нам на безкоштовному форумі підтримки, якщо вам потрібна будь-яка допомога щодо будь-якого іншого випадку використання чи сценарію. Ми будемо мати честь вам допомогти!

Дивись також