ในการฝังเนื้อหาของเอกสาร Word ลงในแอปพลิเคชันของคุณ คุณอาจต้องทำการแปลง การแปลงที่เลือกใช้กันอย่างแพร่หลายในกรณีดังกล่าวคือ Word เป็น HTML หรือ Word เป็นรูปภาพ บทความนี้ครอบคลุมวิธีการแปลงไฟล์ Word DOCX หรือ DOC เป็น HTML โดยใช้ Java นอกจากนี้ เราจะพูดถึงวิธีเก็บไฟล์ทรัพยากรไว้ในโฟลเดอร์แยกต่างหาก
- Java API สำหรับการแปลง Word เป็น HTML
- แปลงเอกสาร Word เป็น HTML
- ระบุโฟลเดอร์ทรัพยากรในการแปลง Word เป็น HTML
Java API สำหรับการแปลง Word เป็น HTML
สำหรับการแปลง DOCX/DOC เป็น HTML เราจะใช้ Aspose.Words for Java เป็น API ที่มีประสิทธิภาพในการใช้คุณสมบัติการประมวลผลคำจากภายในแอปพลิเคชัน Java นอกจากนี้ API ยังให้การแปลงเอกสาร Word เป็น HTML และ [รูปแบบอื่นๆ] ที่มีความเที่ยงตรงสูงอีกด้วย คุณสามารถ ดาวน์โหลด API หรือติดตั้งจาก Maven
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.10</version>
<type>pom</type>
</dependency>
แปลงเอกสาร Word เป็น HTML ใน Java
หากต้องการแปลงเอกสาร Word เป็น HTML คุณต้องโหลดเอกสารและบันทึกเป็นไฟล์ HTML เท่านั้น ต่อไปนี้เป็นขั้นตอนในการแปลงไฟล์ Word DOCX เป็น HTML โดยใช้ Java
- โหลดเอกสาร Word โดยใช้คลาส Document
- แปลงเอกสาร Word เป็น HTML โดยใช้วิธี Document.save(string, SaveFormat)
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงเอกสาร Word เป็น HTML โดยใช้ Java
// โหลดเอกสารจากดิสก์
Document doc = new Document("document.docx");
// บันทึกเอกสารเป็น HTML
doc.save("Document_out.html", SaveFormat.HTML);
ระบุโฟลเดอร์ทรัพยากรในการแปลง Word เป็น HTML
คุณยังสามารถกำหนดค่า API เพื่อบันทึกไฟล์ทรัพยากรในโฟลเดอร์แยกต่างหาก ยิ่งไปกว่านั้น คุณสามารถเก็บฟอนต์และรูปภาพแยกกันในโฟลเดอร์ต่างๆ ต่อไปนี้เป็นขั้นตอนในการระบุโฟลเดอร์ทรัพยากร
- โหลดเอกสาร Word โดยใช้คลาส Document
- สร้างวัตถุของคลาส HtmlSaveOptions
- ตั้งค่าโฟลเดอร์ทรัพยากรโดยใช้เมธอด HtmlSaveOptions.setResourceFolder
- แปลงเอกสาร Word เป็น HTML โดยใช้วิธี Document.save(string, HtmlSaveOptions)
ตัวอย่างโค้ดต่อไปนี้เก็บไฟล์ทรัพยากรไว้ในโฟลเดอร์แยกต่างหากในการแปลง Word เป็น HTML
// โหลดเอกสาร
Document doc = new Document("Document.docx");
// ระบุโฟลเดอร์ทรัพยากร
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");
// แปลงเอกสาร Word เป็น HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);
คุณสามารถ อ่านเพิ่มเติม เกี่ยวกับการทำงานกับโฟลเดอร์ทรัพยากรในการแปลง Word เป็น HTML
รับใบอนุญาต API ฟรี
คุณสามารถใช้ Aspose.Words for Java ได้โดยไม่มีข้อจำกัดในการประเมินโดยรับ ใบอนุญาตชั่วคราว ฟรี
บทสรุป
ในบทความนี้ คุณได้เรียนรู้วิธีการแปลงไฟล์ Word DOCX หรือ DOC เป็น HTML โดยทางโปรแกรมโดยใช้ Java นอกจากนี้ คุณได้เห็นวิธีจัดเก็บไฟล์ทรัพยากรแยกกันในการแปลง Word เป็น HTML นอกจากนี้ คุณสามารถอ่านเพิ่มเติมเกี่ยวกับ Aspose.Words for Java ได้โดยใช้ เอกสารประกอบ นอกจากนี้ คุณสามารถแบ่งปันคำถามของคุณกับเราได้ที่ ฟอรัม