I file HTML vengono solitamente utilizzati per visualizzare informazioni su siti Web o applicazioni Web. In realtà è un testo di markup che ti consente anche di formattare il testo. A volte i file HTML sono piuttosto grandi perché potrebbero contenere molti dati inclusi testo, immagini, grafici, diagrammi e molti altri contenuti. Potrebbe essere necessario dividere i file HTML in base a requisiti o casi d’uso diversi. Esaminiamo come dividere un file HTML in più file usando C#.
Splitter HTML in C# – Installazione API
L’API Aspose.HTML for .NET supporta la creazione o la manipolazione di pagine Web HTML nelle applicazioni basate su .NET Framework utilizzando il linguaggio di programmazione C#. Puoi installare facilmente l’API scaricando i file DLL più recenti dalla sezione Download o tramite la galleria NuGet con il seguente comando di installazione:
PM> Install-Package Aspose.Html
Dividi la pagina Web HTML in più file in C#
Aspose.HTML per .NET API ha un ricco set di funzionalità. Consente di copiare il contenuto del documento HTML caricato in un altro documento HTML. Tuttavia, poiché l’HTML non è un formato a layout fisso e non ha pagine fino a quando non lo stampiamo su un dispositivo particolare come PDF, DOCX, ecc. Quindi non possiamo trovare alcun metodo o proprietà che possa dividere il contenuto in pagine come altri fissi- formati di layout. Pertanto, è necessario trovare il posto corretto per dividere l’HTML e progettare di conseguenza la logica di divisione.
In questo esempio, prenderemo in considerazione un esempio in cui è necessario dividere una pagina Web HTML in base agli elementi del paragrafo. Pertanto, i seguenti passaggi mostrano come dividere la pagina Web HTML per paragrafo:
- Carica la pagina Web HTML di input
- Trova tutti gli elementi di paragrafo all’interno del documento HTML utilizzando Selettore query
- Crea un documento vuoto per dividere il file HTML.
- Salva i file HTML di output
Il frammento di codice di seguito elabora ulteriormente come suddividere la pagina Web HTML in più file utilizzando C#:
String content = File.ReadAllText(dataDir1 + "Product.html");
// Crea un'istanza di documento HTML
var document = new HTMLDocument(content, "");
// Dividi la pagina Web HTML in più file
// trova tutti gli elementi di paragrafo all'interno del documento utilizzando CSS Selector Query
var elements = document.QuerySelectorAll("p");
for (int i = 0; i < elements.Length; i++)
{
// creare un documento vuoto per esportare il contenuto
using (var copyTo = new HTMLDocument())
{
// aggiungere il contenuto al documento creato in precedenza
copyTo.DocumentElement.AppendChild(elements[i]);
// salva il documento
copyTo.Save(dataDir1 + "doc_" + i + ".html", HTMLSaveFormat.HTML);
}
}
Conclusione
In questo articolo, abbiamo appreso come suddividere una pagina Web HTML in più file utilizzando C#. Abbiamo considerato l’esempio della divisione del file in base a diversi elementi di paragrafo. Allo stesso modo, puoi improvvisare la logica per dividere 5 o 10 paragrafi in ogni file di output. Possono esserci diversi altri casi d’uso per dividere la pagina Web HTML in base alle tue esigenze. Non esitare a scriverci al Forum di supporto gratuito se hai bisogno di assistenza su qualsiasi altro caso d’uso o scenario. Saremo onorati di assisterti!