דפי HTML נמצאים בשימוש נרחב באינטרנט. הם עשויים להכיל תמונות, ציורים וטקסט להצגת מידע. לפעמים, ייתכן שיהיה עליך להמיר קובץ HTML לטקסט. בהתאם לכך, מאמר זה מכסה כיצד להמיר HTML ל-טקסט באופן פרוגרמטי ב-Java.
ממיר HTML ל-TXT - התקנת Java API
Aspose.HTML for Java API תומך ב-HTML, MHTML, Text ועוד רבים אחרים פורמטים של קובץ. אתה יכול להגדיר במהירות את ה-API על ידי הורדת קובץ ה-JAR שלו מהקטע מהדורות חדשות, או דרך התצורות הבאות כדי לגשת אליו ממאחסן Aspose:
מאגר:
<repositories>
<repository>
<id>snapshots</id>
<name>repo</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
תלות:
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-html</artifactId>
<version>22.7</version>
<classifier>jdk17</classifier>
</dependency>
</dependencies>
כיצד להמיר HTML ל-TXT ב-Java
אתה יכול להמיר דף אינטרנט HTML לקובץ TXT עם השלבים הבאים:
- גש לדף האינטרנט של ה-HTML המקור.
- ציין את המאפיינים הנדרשים להמרה.
- המרת קובץ HTML לפורמט TXT.
החלק הבא מרחיב יותר את תהליך ההמרה.
המרת HTML לטקסט באופן פרוגרמטי ב-Java
השלבים הבאים מראים כיצד להמיר HTML לטקסט באופן פרוגרמטי ב-Java:
- טען את קובץ HTML הקלט עם המחלקה HTMLDocument.
- צור אובייקט במחלקה TextSaveOptions.
- המר את ה-HTML לקובץ טקסט.
הקוד לדוגמה הבא מראה כיצד להמיר HTML לטקסט באופן פרוגרמטי ב-Java:
// הכן קוד HTML ושמור אותו בקובץ
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
fileWriter.write(code);
}
// אתחול מסמך HTML מהקובץ
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
// אתחול אובייקט המחלקה TextSaveOptions
com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
// המרת HTML לטקסט
com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
if (document != null) {
document.dispose();
}
}
חקור את Aspose.HTML עבור Java
אתה יכול לחקור תכונות רבות אחרות של ה-API על ידי ביקור במרחב תיעוד. הוא מכיל חלקים ופרקים שונים כדי להסביר את השיטות והמאפיינים שנחשפו על ידי מחלקות שונות של ה-API.
סיכום
לסיכום, חקרתם כיצד להמיר HTML לטקסט באופן פרוגרמטי ב-Java. זה יכול להיות שימושי לייצא את מחרוזת הטקסט מדף ה-HTML לפורמט TXT רגיל. יתר על כן, אנא אל תהסס ליצור איתנו קשר דרך פורום בכל מקרה של חששות.