แปลงไฟล์ HTML เป็น Word DOCX DOC ใน Java

ในหลายกรณี คุณอาจต้องแปลงเนื้อหา HTML เป็นเอกสาร Word ตัวอย่างเช่น สำหรับการสร้างเอกสารจากโปรแกรมแก้ไข WYSIWYG HTML หรือแปลงหน้าเว็บเป็นรูปแบบ DOCX หรือ DOC หากต้องการทำการแปลงนี้โดยทางโปรแกรม บทความนี้ครอบคลุมวิธีการแปลงไฟล์ HTML เป็น Word DOCX, DOC, DOCM หรือรูปแบบอื่นๆ ใน Java

Java Library เพื่อแปลง HTML เป็น Word

ในการแปลง HTML เป็น DOCX, DOC, DOT, DOCM และรูปแบบ Word อื่นๆ เราจะใช้ Aspose.Words for Java เป็นไลบรารีที่มีประสิทธิภาพในการสร้างและจัดการเอกสาร Word โดยทางโปรแกรม นอกจากนี้ยังมีตัวแปลงเอกสารในตัวที่ให้การแปลง/เป็นเอกสารประมวลผล Word ที่มีความเที่ยงตรงสูง คุณสามารถดาวน์โหลด JAR ของ API ได้จาก ส่วนการดาวน์โหลด หรือติดตั้งโดยใช้การกำหนดค่า Maven ต่อไปนี้ใน pom.xml

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

แปลง HTML เป็น DOCX/DOC/DOCM ใน Java

การใช้ Aspose.Words for Java การแปลงไฟล์ HTML เป็นรูปแบบ Word สามารถทำได้ใน 2-3 ขั้นตอน ซึ่งจะกล่าวถึงด้านล่าง

  • โหลดไฟล์ HTML โดยใช้คลาส Document
  • บันทึกไฟล์ HTML เป็นเอกสาร Word โดยใช้วิธี Document.save(string, SaveFormat)

เมธอด SaveFormat ใน Document.save() จะระบุรูปแบบที่คุณต้องการแปลงไฟล์ HTML ตัวอย่างโค้ดต่อไปนี้แสดงวิธีสร้างเอกสาร Word จาก HTML ใน Java

// โหลดไฟล์ HTML โดยใช้คลาส Document
Document document = new Document("template.html");

// แปลงไฟล์ HTML เป็นรูปแบบ Word DOCX
document.save("output.docx", SaveFormat.DOCX); 

แปลงหน้าเว็บเป็น Word โดยใช้ URL ใน Java

คุณยังสามารถแปลงหน้าเว็บเป็นเอกสาร Word ได้โดยตรงจาก URL ต่อไปนี้เป็นขั้นตอนในการแปลง HTML เป็น DOCX โดยใช้ URL ใน Java

  • สร้างอินสแตนซ์ของคลาส URL และเริ่มต้นด้วย URL ที่ต้องการ
  • เปิด URL ในวัตถุ InputStream
  • สร้างอินสแตนซ์ของคลาส HtmlLoadOptions
  • สร้างอินสแตนซ์ของคลาส Document และเริ่มต้นด้วยออบเจกต์ InputStream และ HtmlLoadOptions
  • บันทึกหน้าเว็บเป็นเอกสาร Word โดยใช้วิธี Document.save(string, SaveFormat)

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแปลงหน้าเว็บเป็นเอกสาร Word โดยใช้ URL

// สร้างและเริ่มต้น URL
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");

// รับหน้าเว็บเป็นสตรีมอินพุต
InputStream is = oracleURL.openStream();

// เริ่มต้นตัวเลือกการโหลด HTML
HtmlLoadOptions htmloptions = new HtmlLoadOptions();

// โหลดสตรีมลงในวัตถุเอกสาร
Document doc = new Document(is, htmloptions);

// บันทึกเป็น DOCX
doc.save("output.docx", SaveFormat.DOCX);

แปลงสตริง HTML เป็น Word โดยใช้ Java

Aspose.Words for Java ยังช่วยให้คุณสร้างเอกสาร Word จากสตริง HTML แบบไดนามิก ต่อไปนี้เป็นขั้นตอนในการดำเนินการนี้

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแปลงสตริง HTML เป็นไฟล์ DOCX โดยใช้ Java

// สร้างเอกสารใหม่
Document doc = new Document();

// สร้างตัวสร้างเอกสาร
DocumentBuilder builder = new DocumentBuilder(doc);

// แทรก HTML
builder.insertHtml("<ul>\r\n" + 
    "<li>Item1</li>\r\n" + 
    "<li>Item2</li>\r\n" + 
    "</ul>");

// บันทึกเป็น DOCX
doc.save("html-string-to-word.docx", SaveFormat.DOCX);

รับใบอนุญาต API ฟรี

คุณสามารถใช้ Aspose.Words for Java ได้โดยไม่มีข้อจำกัดในการประเมินโดยรับ ใบอนุญาตชั่วคราว ฟรี

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแปลงไฟล์ HTML เป็น Word DOCX, DOC, DOCM หรือรูปแบบอื่นๆ โดยทางโปรแกรมโดยใช้ Java นอกจากนี้ คุณได้เห็นวิธีแปลงสตริง HTML หรือหน้าเว็บจาก URL เป็นเอกสาร Word แบบไดนามิก คุณสามารถติดตั้ง Aspose.Words for Java และใช้รหัสที่ให้มาเพื่อสร้างตัวแปลง HTML เป็น Word นอกจากนี้ คุณสามารถไปที่ เอกสารประกอบ เพื่อสำรวจเพิ่มเติมเกี่ยวกับ Aspose.Words for Java นอกจากนี้ คุณสามารถแบ่งปันคำถามของคุณกับเราได้ที่ ฟอรัม

ดูสิ่งนี้ด้วย

ข้อมูล: หากคุณต้องการรับเอกสาร Word จากงานนำเสนอ PowerPoint คุณสามารถใช้ Aspose Presentation to Word Document converter