HTML לטקסט Java

דפי HTML נמצאים בשימוש נרחב באינטרנט. הם עשויים להכיל תמונות, ציורים וטקסט להצגת מידע. לפעמים, ייתכן שיהיה עליך להמיר קובץ HTML לטקסט. בהתאם לכך, מאמר זה מכסה כיצד להמיר HTML ל-טקסט באופן פרוגרמטי ב-Java.

ממיר HTML ל-TXT - התקנת Java API

Aspose.HTML for Java API תומך ב-HTML, MHTML, Text ועוד רבים אחרים פורמטים של קובץ. אתה יכול להגדיר במהירות את ה-API על ידי הורדת קובץ ה-JAR שלו מהקטע מהדורות חדשות, או דרך התצורות הבאות כדי לגשת אליו ממאחסן Aspose:

מאגר:

 <repositories>
   <repository>
     <id>snapshots</id>
     <name>repo</name>
     <url>http://repository.aspose.com/repo/</url>
   </repository>
</repositories>

תלות:

 <dependencies>
  <dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-html</artifactId>
    <version>22.7</version>
    <classifier>jdk17</classifier>
  </dependency>
</dependencies>

כיצד להמיר HTML ל-TXT ב-Java

אתה יכול להמיר דף אינטרנט HTML לקובץ TXT עם השלבים הבאים:

 1. גש לדף האינטרנט של ה-HTML המקור.
 2. ציין את המאפיינים הנדרשים להמרה.
 3. המרת קובץ HTML לפורמט TXT.

החלק הבא מרחיב יותר את תהליך ההמרה.

המרת HTML לטקסט באופן פרוגרמטי ב-Java

השלבים הבאים מראים כיצד להמיר HTML לטקסט באופן פרוגרמטי ב-Java:

 1. טען את קובץ HTML הקלט עם המחלקה HTMLDocument.
 2. צור אובייקט במחלקה TextSaveOptions.
 3. המר את ה-HTML לקובץ טקסט.

הקוד לדוגמה הבא מראה כיצד להמיר HTML לטקסט באופן פרוגרמטי ב-Java:

// הכן קוד HTML ושמור אותו בקובץ
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
  fileWriter.write(code);
}

// אתחול מסמך HTML מהקובץ
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
  // אתחול אובייקט המחלקה TextSaveOptions
  com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
  
  // המרת HTML לטקסט
  com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
  if (document != null) {
    document.dispose();
  }
}

חקור את Aspose.HTML עבור Java

אתה יכול לחקור תכונות רבות אחרות של ה-API על ידי ביקור במרחב תיעוד. הוא מכיל חלקים ופרקים שונים כדי להסביר את השיטות והמאפיינים שנחשפו על ידי מחלקות שונות של ה-API.

סיכום

לסיכום, חקרתם כיצד להמיר HTML לטקסט באופן פרוגרמטי ב-Java. זה יכול להיות שימושי לייצא את מחרוזת הטקסט מדף ה-HTML לפורמט TXT רגיל. יתר על כן, אנא אל תהסס ליצור איתנו קשר דרך פורום בכל מקרה של חששות.

ראה גם