Buat, Baca, dan Edit File HTML di C#

Jika Anda seorang pemrogram C# yang mencari cara efisien untuk bekerja dengan file HTML, maka artikel ini cocok untuk Anda. Kami akan menjelaskan dasar-dasar cara kerja C# dengan file HTML, mulai dari membuatnya dari awal hingga membaca dan mengedit dokumen yang ada. Pada artikel ini, kita akan mempelajari cara membuat, membaca, dan mengedit file HTML di C#.

HTML (Hyper Text Markup Language) adalah bahasa yang digunakan untuk membuat situs web dan halaman web. C#, di sisi lain, adalah bahasa pemrograman berorientasi objek yang digunakan untuk membangun aplikasi. File HTML berisi tag markup yang digunakan untuk memformat struktur halaman web untuk ditampilkan di browser. Kita dapat dengan mudah memanipulasi file HTML secara terprogram dalam aplikasi .NET. Pada artikel ini, kita akan mengeksplorasi bagaimana menggunakan C# untuk membaca, menulis, dan mengedit file HTML. Kita akan melihat cara mengurai kode HTML untuk elemen tertentu dan membuat elemen baru dari awal atau mengedit yang sudah ada. Mari kita mulai!

Topik-topik berikut akan dibahas dalam artikel ini:

  1. C# API untuk membuat, membaca, dan mengedit file HTML
  2. Buat file HTML
  3. Baca file HTML
  4. Edit file HTML
  5. Tambahkan konten HTML mentah di C#

C# API untuk Membuat, Membaca, dan Mengedit File HTML

Untuk membuat, membaca, dan mengedit file HTML, kita akan menggunakan API Aspose.HTML for .NET. Ini adalah API pemrosesan HTML lanjutan yang memungkinkan pembuatan, modifikasi, dan ekstraksi data dari dokumen HTML. Itu juga memungkinkan konversi dan rendering dokumen HTML tanpa perangkat lunak eksternal apa pun.

Kelas HTMLDocument dari API merepresentasikan dokumen HTML atau halaman HTML yang kita lihat di browser. Metode CreateElement() dari kelas ini membuat elemen HTML yang ditentukan oleh tagName. Metode CreateTextNode(string) membuat simpul Teks dengan string yang ditentukan. Metode AppendChild() dari antarmuka Node menambahkan node ke akhir daftar anak dari node induk tertentu. Metode Save() menyimpan file keluaran. Anda juga dapat membaca selengkapnya tentang ruang nama DOM di dokumentasi.

Harap unduh DLL dari API atau instal menggunakan NuGet.

PM> Install-Package Aspose.Html

Buat File HTML di C#

Kami dapat dengan mudah membuat file HTML dengan mengikuti langkah-langkah yang diberikan di bawah ini:

  1. Pertama, buat instance dari kelas HTMLDocument.
  2. Selanjutnya, panggil metode CreateElement() untuk membuat elemen seperti judul, paragraf, teks, dll.
  3. Kemudian, panggil metode CreateTextNode() untuk menambahkan node teks.
  4. Selanjutnya, tambahkan simpul yang dibuat ke elemen menggunakan metode AppendChild().
  5. Setelah itu, lampirkan elemen ke badan dokumen menggunakan metode HTMLDocument.Body.AppendChild() .
  6. Ulangi langkah di atas untuk menambahkan lebih banyak elemen.
  7. Terakhir, simpan dokumen HTML menggunakan metode Save(). Dibutuhkan jalur file keluaran sebagai argumen.

Contoh kode berikut menunjukkan cara membuat file HTML menggunakan C#.

Buat-file-HTML-di-CSharp

Buat file HTML di C#

Baca File HTML di C#

Di bagian sebelumnya, kami membuat file HTML. Sekarang, kita akan memuat file dan membaca kontennya dengan mengikuti langkah-langkah di bawah ini:

  1. Muat file HTML yang ada menggunakan kelas HTMLDocument.
  2. Baca dan tampilkan konten HTMLDocument.DocumentElement.OuterHTML.

Contoh kode berikut menunjukkan cara membaca file HTML menggunakan C#.

// Contoh kode ini menunjukkan cara membaca file HTML
// Siapkan jalur keluaran untuk penyimpanan dokumen
string documentPath = @"C:\Files\html\create-new-document.html";

// Muat file HTML
var document = new HTMLDocument(documentPath);

// Tulis konten dokumen ke aliran output
Console.WriteLine(document.DocumentElement.OuterHTML);
<html><head></head><body><h2>This is Sample Heading!</h2><p id="first-paragraph">This is first paragraph. </p><ol><li>First list item.</li><li>Second list item.</li></ol></body></html>

Edit File HTML di C#

Kami juga dapat memperbarui konten file HTML. Kita dapat menambahkan lebih banyak node/elemen dengan mengikuti langkah-langkah yang disebutkan di atas. Namun, kita dapat memodifikasi catatan/elemen yang ada dengan mengikuti langkah-langkah di bawah ini:

  1. Muat file HTML yang ada menggunakan kelas HTMLDocument.
  2. Selanjutnya, panggil metode CreateTextNode() untuk menambahkan simpul teks.
  3. Selanjutnya, dapatkan elemen paragraf pertama menggunakan metode GetElementsByTagName(). Dibutuhkan “p” sebagai argumen.
  4. Setelah itu, panggil metode AppendChild() untuk menambahkan simpul teks.
  5. Ulangi langkah di atas untuk memodifikasi lebih banyak elemen.
  6. Terakhir, simpan dokumen HTML menggunakan metode Save(). Dibutuhkan jalur file keluaran sebagai argumen.

Contoh kode berikut menunjukkan cara memodifikasi file HTML menggunakan C#.

// Contoh kode ini mendemonstrasikan bagaimana mengedit isi dari file HTML.
// Siapkan jalur keluaran untuk penyimpanan dokumen
string documentPath = @"C:\Files\html\create-new-document.html";

// Buat instance dari dokumen HTML
var document = new HTMLDocument(documentPath);

// Buat simpul teks
var oldParaText = document.CreateTextNode("This is old first paragraph.");

// Dapatkan elemen paragraf pertama
var p = (HTMLParagraphElement)document.GetElementsByTagName("p").First();
p.AppendChild(oldParaText);

// Simpan dokumen HTML ke file 
document.Save(@"C:\Files\html\modify.html");
Edit-an-HTML-File-in-CSharp

Edit file HTML di C#

Contoh kode berikut menunjukkan contoh yang lebih kompleks di mana kita menambahkan elemen baru dan memodifikasi elemen yang sudah ada.

// Contoh kode ini menunjukkan cara dan dan mengedit elemen dalam file HTML yang keluar.
// Siapkan jalur keluaran untuk penyimpanan dokumen
string documentPath = @"C:\Files\html\create-new-document.html";

// Buat instance dari dokumen HTML
var document = new HTMLDocument(documentPath);

// Buat elemen gaya dan beri warna hijau untuk semua elemen dengan nama kelas sama dengan 'gr'.
var style = document.CreateElement("style");
style.TextContent = ".rd { color: red }";

// Temukan elemen tajuk dokumen dan tambahkan elemen gaya ke tajuk
var head = document.GetElementsByTagName("head").First();
head.AppendChild(style);

// Buat simpul teks
var oldParaText = document.CreateTextNode("This is old first paragraph.");

// Buat elemen paragraf dengan nama kelas 'gr'.
var p = (HTMLParagraphElement)document.GetElementsByTagName("p").First();
p.ClassName = "rd";
p.AppendChild(oldParaText);

// Buat elemen paragraf
var newPara = (HTMLParagraphElement)document.CreateElement("p");

// Buat simpul teks
var paraText = document.CreateTextNode("This is second paragraph. ");

// Tambahkan teks ke paragraf
newPara.AppendChild(paraText);

// Lampirkan paragraf ke badan dokumen 
document.Body.AppendChild(newPara);

// Simpan dokumen HTML ke file 
document.Save(@"C:\Files\html\edit.html");
Tambahkan-Edit-Elemen-dalam-HTML-File-menggunakan-CSharp

Tambahkan dan edit elemen dalam file HTML menggunakan C#

Tambahkan Konten HTML Mentah di C#

Kita dapat menambah atau mengedit elemen dengan menambahkan kode HTML secara manual sebagai konten menggunakan properti InnerHTML dari suatu elemen. Kami dapat menambahkan HTML mentah dengan mengikuti langkah-langkah yang diberikan di bawah ini:

  1. Pertama, buat instance dari kelas HTMLDocument.
  2. Selanjutnya, atur konten elemen Body.InnerHTML sebagai string HTML mentah.
  3. Terakhir, simpan dokumen HTML menggunakan metode Save(). Dibutuhkan jalur file keluaran sebagai argumen.

Contoh kode berikut menunjukkan cara menambahkan konten HTML mentah ke file menggunakan C#.

// Contoh kode ini menunjukkan cara menambahkan HTML mentah ke badan HTML.
// Buat instance dari dokumen HTML
using (var document = new HTMLDocument())
{
    // Tulis konten dokumen HTML ke dalam keluaran konsol
    Console.WriteLine(document.DocumentElement.OuterHTML); 

    // Tetapkan konten elemen tubuh
    document.Body.InnerHTML = "<p>HTML is the standard markup language for Web pages.</p>";

    /// Simpan dokumen HTML ke file 
    document.Save(@"C:\Files\html\using-innerHTML.html");
}
Tambahkan-Raw-HTML-Konten-dalam-CSharp

Tambahkan HTML mentah dalam file HTML menggunakan C#

Dapatkan Lisensi Gratis

Anda bisa mendapatkan lisensi sementara gratis untuk mencoba Aspose.HTML for .NET tanpa batasan evaluasi.

Kesimpulan

Dalam artikel ini, kita telah mempelajari cara:

  • membuat dokumen HTML secara terprogram;
  • memuat dokumen HTML yang ada dari jalur disk lokal;
  • baca HTML dari file yang dimuat;
  • tambahkan konten baru ke file HTML yang ada;
  • memodifikasi konten yang ada di C#.

Selain membuat, membaca, dan mengedit file HTML di C#, Anda dapat mempelajari lebih lanjut tentang Aspose.HTML for .NET API menggunakan dokumentasi. Jika ada ambiguitas, jangan ragu untuk menghubungi kami di forum dukungan gratis.

Lihat juga