פיצול דף אינטרנט HTML

קבצי HTML משמשים בדרך כלל להצגת מידע באתרי אינטרנט או ביישומי אינטרנט. זהו למעשה טקסט סימון המאפשר לך לעצב גם את הטקסט. לפעמים קובצי HTML גדולים למדי מכיוון שהם עשויים להכיל נתונים רבים, כולל טקסט, תמונות, תרשימים, דיאגרמות ותכנים רבים אחרים. ייתכן שיהיה עליך לפצל קובצי HTML לפי דרישות או מקרי שימוש שונים. הבה נחקור כיצד לפצל קובץ HTML למספר קבצים באמצעות C#.

מפצל HTML ב-C# – התקנת API

Aspose.HTML for .NET API תומך ביצירה או מניפולציה של דפי HTML ביישומים מבוססי .NET Framework שלך באמצעות שפת התכנות C#. אתה יכול בקלות להתקין את ה-API על ידי הורדת קבצי ה-DLL העדכניים ביותר מקטע הורדות או דרך גלריית NuGet עם פקודת ההתקנה הבאה:

PM> Install-Package Aspose.Html

פיצול דף אינטרנט HTML למספר קבצים ב-C#

ל-Aspose.HTML עבור .NET API יש סט עשיר של תכונות. זה מאפשר להעתיק תוכן של מסמך HTML שנטען למסמך HTML אחר. עם זאת, מכיוון שה-HTML אינו פורמט של פריסה קבועה ואין לו דפים עד שאנו מדפיסים אותו למכשיר מסוים כמו PDF, DOCX וכו’. לכן איננו יכולים למצוא שום שיטה או נכס שיכולים לפצל את התוכן לדפים כמו אחרים קבועים- פורמטים של פריסה. לכן, עליך למצוא את המקום המתאים לפצל את ה-HTML ולעצב את היגיון הפיצול בהתאם.

בדוגמה זו, נשקול דוגמה שבה אתה צריך לפצל דף אינטרנט HTML על סמך רכיבי פסקה. לכן, השלבים הבאים מראים כיצד לפצל דף אינטרנט HTML לפי פסקה:

  1. טען דף אינטרנט קלט HTML
  2. מצא את כל רכיבי הפסקה בתוך מסמך HTML באמצעות בורר שאילתות
  3. צור מסמך ריק כדי לפצל קובץ HTML
  4. שמור קובצי HTML פלט

קטע הקוד שלהלן מפרט כיצד לפצל דף אינטרנט HTML למספר קבצים באמצעות C#:

String content = File.ReadAllText(dataDir1 + "Product.html");
// צור מופע של מסמך HTML
var document = new HTMLDocument(content, "");
            
// פיצול דף אינטרנט HTML למספר קבצים
// מצא את כל רכיבי הפסקה בתוך המסמך על ידי שימוש ב-CSS Selector Query
var elements = document.QuerySelectorAll("p");
for (int i = 0; i < elements.Length; i++)
{
    // ליצור מסמך ריק לייצא תוכן
    using (var copyTo = new HTMLDocument())
    {
        // הוסף את התוכן למסמך שנוצר קודם לכן
        copyTo.DocumentElement.AppendChild(elements[i]);
        // לשמור את המסמך
        copyTo.Save(dataDir1 + "doc_" + i + ".html", HTMLSaveFormat.HTML);
    }
}

סיכום

במאמר זה, למדנו על פיצול דף אינטרנט HTML למספר קבצים באמצעות C#. שקלנו את הדוגמה של פיצול הקובץ על סמך רכיבי פסקה שונים. כמו כן, אתה יכול לאלתר את ההיגיון לפצל 5 או 10 פסקאות בכל קובץ פלט. יכולים להיות מקרי שימוש שונים אחרים לפיצול דף האינטרנט של HTML לפי הדרישות שלך. אנא אל תהסס לכתוב לנו ב Free Support Forum אם אתה זקוק לסיוע כלשהו לגבי מקרה שימוש או תרחיש אחר. נשמח לעזור לך!

ראה גם