המר קבצי HTML ל- Word DOCX DOC ב-Java

במקרים שונים, ייתכן שיהיה עליך להמיר את תוכן ה-HTML למסמך Word. לדוגמה, להפקת המסמך מעורך HTML של WYSIWYG או המרת דף אינטרנט לפורמט DOCX או DOC. כדי לבצע המרה זו באופן פרוגרמטי, מאמר זה מכסה כיצד להמיר קובצי HTML ל-Word DOCX, DOC, DOCM, או פורמטים אחרים ב-Java.

ספריית Java להמרת HTML ל-Word

כדי להמיר HTML ל-DOCX, DOC, DOT, DOCM ופורמטים אחרים של Word, נשתמש ב-Aspose.Words for Java. זוהי ספרייה רבת עוצמה ליצור ולתפעל מסמכי Word באופן תוכנתי. יתר על כן, הוא מספק ממיר מסמכים מובנה המספק המרת נאמנות גבוהה של/למסמכי עיבוד וורד. אתה יכול להוריד את ה-JAR של ממשק ה-API מסעיף ההורדות או להתקין אותו באמצעות התצורות הבאות של Maven ב-pom.xml.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

המרת HTML ל-DOCX/DOC/DOCM ב-Java

באמצעות Aspose.Words עבור Java, ניתן לבצע המרה של קובץ HTML לפורמט Word בכמה שלבים, המוזכרים להלן.

השיטה SaveFormat enum ב-Document.save() מציינת את הפורמט שבו ברצונך להמיר את קובץ ה-HTML. דוגמת הקוד הבאה מראה כיצד ליצור מסמך Word מ-HTML ב-Java.

// טען קובץ HTML באמצעות מחלקת Document
Document document = new Document("template.html");

// המרת קובץ HTML לפורמט Word DOCX
document.save("output.docx", SaveFormat.DOCX); 

המר דף אינטרנט ל-Word באמצעות כתובת URL ב-Java

אתה יכול גם להמיר דף אינטרנט למסמך Word ישירות מכתובת האתר שלו. להלן השלבים להמרת HTML ל-DOCX באמצעות URL ב-Java.

  • צור מופע של מחלקה URL ואתחל אותו עם כתובת האתר הרצויה.
  • פתח את כתובת האתר לאובייקט InputStream.
  • צור מופע של מחלקה HtmlLoadOptions.
  • צור מופע של המחלקה Document ואתחול אותו עם אובייקטים של InputStream ו-HtmlLoadOptions.
  • שמור את דף האינטרנט כמסמך Word באמצעות השיטה Document.save(string, SaveFormat).

דוגמת הקוד הבאה מראה כיצד להמיר דף אינטרנט למסמך Word באמצעות כתובת URL.

// צור ואתחול כתובת אתר
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// קבל דף אינטרנט כזרם קלט
InputStream is = oracleURL.openStream();

// אתחול אפשרויות טעינת HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// טען זרם לתוך אובייקט המסמך
Document doc = new Document(is, htmloptions);

// שמור כ-DOCX
doc.save("output.docx", SaveFormat.DOCX);

המרת מחרוזת HTML ל-Word באמצעות Java

Aspose.Words עבור Java גם מאפשר לך ליצור מסמך Word ממחרוזת HTML באופן דינמי. להלן השלבים לביצוע פעולה זו.

דוגמת הקוד הבאה מראה כיצד להמיר מחרוזת HTML לקובץ DOCX באמצעות Java.

// צור מסמך חדש
Document doc = new Document();

// צור בונה מסמכים
DocumentBuilder builder = new DocumentBuilder(doc);

// הכנס HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// שמור כ-DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

קבל רישיון API בחינם

אתה יכול להשתמש ב-Aspose.Words עבור Java ללא מגבלות הערכה על ידי קבלת רישיון זמני בחינם.

סיכום

במאמר זה, למדת כיצד להמיר קבצי HTML ל-Word DOCX, DOC, DOCM או פורמטים אחרים באופן פרוגרמטי באמצעות Java. יתר על כן, ראית כיצד להמיר מחרוזת HTML או דף אינטרנט מכתובת URL למסמך Word באופן דינמי. אתה יכול פשוט להתקין את Aspose.Words עבור Java ולהשתמש בקוד שסופק כדי לבנות את ממיר ה-HTML ל-Word שלך. חוץ מזה, אתה יכול לבקר בתיעוד כדי לחקור עוד על Aspose.Words עבור Java. יתר על כן, תוכל לשתף אותנו בשאילתותיך בפורום שלנו.

ראה גם

מידע: אם אי פעם תצטרך לקבל מסמך Word ממצגת PowerPoint, תוכל להשתמש בממיר Aspose מצגת למסמך Word.