במקרים שונים, ייתכן שיהיה עליך להמיר את תוכן ה-HTML למסמך Word. לדוגמה, להפקת המסמך מעורך HTML של WYSIWYG או המרת דף אינטרנט לפורמט DOCX או DOC. כדי לבצע המרה זו באופן פרוגרמטי, מאמר זה מכסה כיצד להמיר קובצי HTML ל-Word DOCX, DOC, DOCM, או פורמטים אחרים ב-Java.
- ספריה להמרת HTML ל-Word
- המר קובץ HTML ל-DOCX/DOC/DOCM וכו’.
- המר דף אינטרנט ל-Word באמצעות כתובת URL
- המרת HTML ל-Word
ספריית Java להמרת HTML ל-Word
כדי להמיר HTML ל-DOCX, DOC, DOT, DOCM ופורמטים אחרים של Word, נשתמש ב-Aspose.Words for Java. זוהי ספרייה רבת עוצמה ליצור ולתפעל מסמכי Word באופן תוכנתי. יתר על כן, הוא מספק ממיר מסמכים מובנה המספק המרת נאמנות גבוהה של/למסמכי עיבוד וורד. אתה יכול להוריד את ה-JAR של ממשק ה-API מסעיף ההורדות או להתקין אותו באמצעות התצורות הבאות של Maven ב-pom.xml.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
המרת HTML ל-DOCX/DOC/DOCM ב-Java
באמצעות Aspose.Words עבור Java, ניתן לבצע המרה של קובץ HTML לפורמט Word בכמה שלבים, המוזכרים להלן.
- טען את קובץ ה-HTML באמצעות המחלקה Document.
- שמור את קובץ ה-HTML כמסמך Word באמצעות השיטה Document.save(string, SaveFormat).
השיטה SaveFormat enum ב-Document.save() מציינת את הפורמט שבו ברצונך להמיר את קובץ ה-HTML. דוגמת הקוד הבאה מראה כיצד ליצור מסמך Word מ-HTML ב-Java.
// טען קובץ HTML באמצעות מחלקת Document
Document document = new Document("template.html");
// המרת קובץ HTML לפורמט Word DOCX
document.save("output.docx", SaveFormat.DOCX);
המר דף אינטרנט ל-Word באמצעות כתובת URL ב-Java
אתה יכול גם להמיר דף אינטרנט למסמך Word ישירות מכתובת האתר שלו. להלן השלבים להמרת HTML ל-DOCX באמצעות URL ב-Java.
- צור מופע של מחלקה URL ואתחל אותו עם כתובת האתר הרצויה.
- פתח את כתובת האתר לאובייקט InputStream.
- צור מופע של מחלקה HtmlLoadOptions.
- צור מופע של המחלקה Document ואתחול אותו עם אובייקטים של InputStream ו-HtmlLoadOptions.
- שמור את דף האינטרנט כמסמך Word באמצעות השיטה Document.save(string, SaveFormat).
דוגמת הקוד הבאה מראה כיצד להמיר דף אינטרנט למסמך Word באמצעות כתובת URL.
// צור ואתחול כתובת אתר
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");
// קבל דף אינטרנט כזרם קלט
InputStream is = oracleURL.openStream();
// אתחול אפשרויות טעינת HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();
// טען זרם לתוך אובייקט המסמך
Document doc = new Document(is, htmloptions);
// שמור כ-DOCX
doc.save("output.docx", SaveFormat.DOCX);
המרת מחרוזת HTML ל-Word באמצעות Java
Aspose.Words עבור Java גם מאפשר לך ליצור מסמך Word ממחרוזת HTML באופן דינמי. להלן השלבים לביצוע פעולה זו.
- צור מופע של מחלקה Document.
- צור מופע של מחלקה DocumentBuilder ואתחול אותו באמצעות Document Object.
- הכנס HTML למסמך באמצעות השיטה DocumentBuilder.InsertHtml(string).
- שמור את מסמך Word באמצעות השיטה Document.save(string, SaveFormat).
דוגמת הקוד הבאה מראה כיצד להמיר מחרוזת HTML לקובץ DOCX באמצעות Java.
// צור מסמך חדש
Document doc = new Document();
// צור בונה מסמכים
DocumentBuilder builder = new DocumentBuilder(doc);
// הכנס HTML
builder.insertHtml("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>");
// שמור כ-DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);
קבל רישיון API בחינם
אתה יכול להשתמש ב-Aspose.Words עבור Java ללא מגבלות הערכה על ידי קבלת רישיון זמני בחינם.
סיכום
במאמר זה, למדת כיצד להמיר קבצי HTML ל-Word DOCX, DOC, DOCM או פורמטים אחרים באופן פרוגרמטי באמצעות Java. יתר על כן, ראית כיצד להמיר מחרוזת HTML או דף אינטרנט מכתובת URL למסמך Word באופן דינמי. אתה יכול פשוט להתקין את Aspose.Words עבור Java ולהשתמש בקוד שסופק כדי לבנות את ממיר ה-HTML ל-Word שלך. חוץ מזה, אתה יכול לבקר בתיעוד כדי לחקור עוד על Aspose.Words עבור Java. יתר על כן, תוכל לשתף אותנו בשאילתותיך בפורום שלנו.
ראה גם
מידע: אם אי פעם תצטרך לקבל מסמך Word ממצגת PowerPoint, תוכל להשתמש בממיר Aspose מצגת למסמך Word.