Pisahkan Halaman Web HTML

File HTML biasanya digunakan untuk menampilkan informasi di situs web atau aplikasi web. Ini sebenarnya adalah teks mark-up yang memungkinkan Anda memformat teks juga. Terkadang file HTML cukup besar karena mungkin berisi banyak data termasuk teks, gambar, bagan, diagram, dan banyak konten lainnya. Anda mungkin perlu membagi file HTML berdasarkan persyaratan atau kasus penggunaan yang berbeda. Mari kita telusuri cara membagi file HTML menjadi beberapa file menggunakan C#.

Pemisah HTML dalam C# – Pemasangan API

Aspose.HTML for .NET API mendukung pembuatan atau manipulasi halaman web HTML di aplikasi berbasis .NET Framework menggunakan bahasa pemrograman C#. Anda dapat dengan mudah menginstal API dengan mendownload file DLL terbaru dari bagian Downloads, atau melalui galeri NuGet dengan perintah instalasi berikut:

PM> Install-Package Aspose.Html

Pisahkan Halaman Web HTML menjadi Beberapa File di C

Aspose.HTML for .NET API memiliki serangkaian fitur yang kaya. Ini memungkinkan untuk menyalin konten dari dokumen HTML yang dimuat ke dalam dokumen HTML lain. Namun, karena HTML bukan format tata letak tetap dan tidak memiliki halaman sampai kami mencetaknya ke perangkat tertentu seperti PDF, DOCX, dll. Jadi kami tidak dapat menemukan metode atau properti apa pun yang dapat membagi konten menjadi halaman seperti fixed- lainnya. format tata letak. Oleh karena itu, Anda perlu menemukan tempat yang tepat untuk membagi HTML dan merancang logika pemisahan yang sesuai.

Dalam contoh ini, kami akan mempertimbangkan contoh di mana Anda perlu membagi halaman web HTML berdasarkan elemen paragraf. Oleh karena itu, langkah-langkah berikut menunjukkan cara membagi halaman web HTML dengan paragraf:

  1. Muat masukan halaman web HTML
  2. Temukan semua elemen paragraf di dalam dokumen HTML dengan menggunakan Query Selector
  3. Buat dokumen kosong untuk memisahkan file HTML.
  4. Simpan file HTML keluaran

Cuplikan kode di bawah ini menjelaskan lebih lanjut cara membagi halaman web HTML menjadi beberapa file menggunakan C#:

String content = File.ReadAllText(dataDir1 + "Product.html");
// Buat sebuah instance dari dokumen HTML
var document = new HTMLDocument(content, "");
            
// Pisahkan halaman web HTML menjadi beberapa file
// temukan semua elemen paragraf di dalam dokumen dengan menggunakan CSS Selector Query
var elements = document.QuerySelectorAll("p");
for (int i = 0; i < elements.Length; i++)
{
    // buat dokumen kosong untuk mengekspor konten
    using (var copyTo = new HTMLDocument())
    {
        // tambahkan konten ke dalam dokumen yang dibuat sebelumnya
        copyTo.DocumentElement.AppendChild(elements[i]);
        // menyimpan dokumen
        copyTo.Save(dataDir1 + "doc_" + i + ".html", HTMLSaveFormat.HTML);
    }
}

Kesimpulan

Pada artikel ini, kita telah belajar tentang membagi halaman web HTML menjadi beberapa file menggunakan C#. Kami telah mempertimbangkan contoh pemisahan file berdasarkan elemen paragraf yang berbeda. Demikian pula, Anda dapat mengimprovisasi logika untuk membagi 5 atau 10 paragraf di setiap file keluaran. Mungkin ada kasus penggunaan lain yang berbeda untuk memisahkan halaman web HTML sesuai kebutuhan Anda. Silakan menulis kepada kami di Forum Dukungan Gratis jika Anda memerlukan bantuan tentang kasus atau skenario penggunaan lainnya. Kami akan merasa terhormat untuk membantu Anda!

Lihat juga