Dividir página da Web HTML

Os arquivos HTML geralmente são usados para exibir informações em sites ou aplicativos da web. Na verdade, é um texto de marcação que permite formatar o texto também. Às vezes, os arquivos HTML são muito grandes porque podem conter muitos dados, incluindo texto, imagens, gráficos, diagramas e muitos outros conteúdos. Você pode precisar dividir arquivos HTML em diferentes requisitos ou casos de uso. Vamos explorar como dividir um arquivo HTML em vários arquivos usando C#.

Divisor HTML em C# – Instalação da API

Aspose.HTML para .NET API oferece suporte à criação ou manipulação de páginas da Web HTML em seus aplicativos baseados em .NET Framework usando a linguagem de programação C#. Você pode instalar facilmente a API baixando os arquivos DLL mais recentes da seção Downloads ou através da galeria NuGet com o seguinte comando de instalação:

PM> Install-Package Aspose.Html

Dividir página da Web HTML em vários arquivos em C#

Aspose.HTML para .NET API tem um rico conjunto de recursos. Permite copiar o conteúdo do documento HTML carregado em outro documento HTML. No entanto, como o HTML não é um formato de layout fixo e não possui páginas até que o imprimamos em um dispositivo específico, como PDF, DOCX, etc. formatos de layout. Portanto, você precisa encontrar o local adequado para dividir o HTML e projetar a lógica de divisão de acordo.

Neste exemplo, consideraremos um exemplo em que você precisa dividir uma página da Web HTML com base em elementos de parágrafo. Portanto, as etapas a seguir mostram como dividir a página da Web HTML por parágrafo:

  1. Carregar página da Web HTML de entrada
  2. Encontre todos os elementos de parágrafo dentro do documento HTML usando Query Selector
  3. Crie um documento vazio para dividir o arquivo HTML
  4. Salvar arquivos HTML de saída

O trecho de código abaixo elabora ainda mais como dividir a página da Web HTML em vários arquivos usando C#:

String content = File.ReadAllText(dataDir1 + "Product.html");
// Criar uma instância de documento HTML
var document = new HTMLDocument(content, "");
            
// Dividir página HTML em vários arquivos
// encontre todos os elementos de parágrafo dentro do documento usando CSS Selector Query
var elements = document.QuerySelectorAll("p");
for (int i = 0; i < elements.Length; i++)
{
    // crie um documento vazio para exportar conteúdo
    using (var copyTo = new HTMLDocument())
    {
        // anexar o conteúdo ao documento criado anteriormente
        copyTo.DocumentElement.AppendChild(elements[i]);
        // salve o documento
        copyTo.Save(dataDir1 + "doc_" + i + ".html", HTMLSaveFormat.HTML);
    }
}

Conclusão

Neste artigo, aprendemos como dividir uma página da Web HTML em vários arquivos usando C#. Consideramos o exemplo de dividir o arquivo com base em diferentes elementos de parágrafo. Da mesma forma, você pode improvisar a lógica para dividir 5 ou 10 parágrafos em cada arquivo de saída. Pode haver diferentes outros casos de uso para dividir a página da Web HTML de acordo com seus requisitos. Sinta-se à vontade para nos escrever no Fórum de suporte gratuito se precisar de ajuda sobre qualquer outro caso de uso ou cenário. Ficaremos honrados em ajudá-lo!

Veja também