Fractionner la page Web HTML

Les fichiers HTML sont généralement utilisés pour afficher des informations sur des sites Web ou des applications Web. Il s’agit en fait d’un texte de balisage qui vous permet également de formater le texte. Parfois, les fichiers HTML sont assez volumineux car ils peuvent contenir beaucoup de données, notamment du texte, des images, des graphiques, des diagrammes et de nombreux autres contenus. Vous devrez peut-être diviser les fichiers HTML selon différentes exigences ou cas d’utilisation. Voyons comment diviser un fichier HTML en plusieurs fichiers à l’aide de C#.

Séparateur HTML en C# - Installation de l’API

L’API Aspose.HTML for .NET prend en charge la création ou la manipulation de pages Web HTML dans vos applications basées sur .NET Framework à l’aide du langage de programmation C#. Vous pouvez facilement installer l’API en téléchargeant les derniers fichiers DLL depuis la section Téléchargements ou via la galerie NuGet avec la commande d’installation suivante :

PM> Install-Package Aspose.Html

Diviser la page Web HTML en plusieurs fichiers en C#

L’API Aspose.HTML for .NET possède un riche ensemble de fonctionnalités. Il permet de copier le contenu du document HTML chargé dans un autre document HTML. Cependant, comme le HTML n’est pas un format de mise en page fixe et n’a pas de pages jusqu’à ce que nous l’imprimions dans un appareil particulier comme PDF, DOCX, etc. Nous ne pouvons donc trouver aucune méthode ou propriété qui puisse diviser le contenu en pages comme d’autres fixes- formats de mise en page. Par conséquent, vous devez trouver le bon endroit pour fractionner le code HTML et concevoir la logique de fractionnement en conséquence.

Dans cet exemple, nous considérerons un exemple dans lequel vous devez diviser une page Web HTML en fonction d’éléments de paragraphe. Par conséquent, les étapes suivantes montrent comment diviser une page Web HTML par paragraphe :

  1. Charger la page Web HTML d’entrée
  2. Trouvez tous les éléments de paragraphe dans le document HTML en utilisant Query Selector
  3. Créer un document vide pour diviser le fichier HTML
  4. Enregistrer les fichiers HTML de sortie

L’extrait de code ci-dessous explique comment diviser une page Web HTML en plusieurs fichiers à l’aide de C# :

String content = File.ReadAllText(dataDir1 + "Product.html");
// Créer une instance de document HTML
var document = new HTMLDocument(content, "");
            
// Diviser la page Web HTML en plusieurs fichiers
// trouver tous les éléments de paragraphe à l'intérieur du document en utilisant CSS Selector Query
var elements = document.QuerySelectorAll("p");
for (int i = 0; i < elements.Length; i++)
{
    // créer un document vide pour exporter le contenu
    using (var copyTo = new HTMLDocument())
    {
        // ajouter le contenu dans le document créé précédemment
        copyTo.DocumentElement.AppendChild(elements[i]);
        // enregistrer le document
        copyTo.Save(dataDir1 + "doc_" + i + ".html", HTMLSaveFormat.HTML);
    }
}

Conclusion

Dans cet article, nous avons appris à diviser une page Web HTML en plusieurs fichiers à l’aide de C#. Nous avons considéré l’exemple de la division du fichier en fonction de différents éléments de paragraphe. De même, vous pouvez improviser la logique pour diviser 5 ou 10 paragraphes dans chaque fichier de sortie. Il peut y avoir différents autres cas d’utilisation pour diviser la page Web HTML selon vos besoins. N’hésitez pas à nous écrire sur Free Support Forum si vous avez besoin d’aide concernant tout autre cas d’utilisation ou scénario. Nous serons honorés de vous aider!

Voir également