Word เป็น HTML Python

จำเป็นต้องมีการแปลง Word เป็น HTML ในหลายกรณี เช่น สำหรับการฝังเนื้อหาของเอกสารบนหน้าเว็บ ในบทความนี้ คุณจะได้เรียนรู้วิธีการแปลงเอกสาร MS Word DOCX หรือ DOC เป็น HTML โดยใช้ Python นอกจากนี้ คุณจะได้เรียนรู้วิธีควบคุมการแปลง Word เป็น HTML แบบไดนามิกโดยใช้ตัวเลือกต่างๆ

Python Word เป็น HTML Converter API

ในการแปลงเอกสาร Word เป็น HTML เราจะใช้ Aspose.Words for Python เป็น API ที่ทรงพลังและเต็มไปด้วยคุณสมบัติสำหรับการสร้างและจัดการเอกสาร Word นอกจากนี้ยังให้การแปลงเอกสาร Word เป็นรูปแบบอื่นที่มีความเที่ยงตรงสูง Aspose.Words for Python มีอยู่ใน PyPI และคุณสามารถติดตั้งได้โดยใช้คำสั่ง pip ต่อไปนี้

pip install aspose-words 

แปลงเอกสาร Word เป็น HTML ใน Python

ต่อไปนี้เป็นขั้นตอนในการแปลงเอกสาร Word เป็นไฟล์ HTML โดยใช้ Python

  • โหลดเอกสาร Word โดยใช้คลาส Document
  • สร้างวัตถุของคลาส HtmlSaveOptions
  • เปิดใช้งานการส่งออกทรัพยากรแบบอักษรโดยใช้คุณสมบัติ HtmlSaveOptions.exportfontresources
  • แปลงเอกสาร Word เป็น HTML โดยใช้วิธี Document.save()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงไฟล์ DOCX เป็น HTML ใน Python

import aspose.words as aw

# โหลดเอกสารจากดิสก์
doc = aw.Document("Document.docx")

# เปิดใช้งานการส่งออกแบบอักษร
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
  
# บันทึกเอกสารเป็น HTML
doc.save("Document.html", options)

ปรับแต่งการแปลง Word เป็น HTML ใน Python

Aspose.Words for Python ยังมีตัวเลือกต่างๆ ในการปรับแต่งการแปลง Word เป็น HTML ตัวอย่างเช่น คุณสามารถแปลงเอกสารที่มีข้อมูลไปกลับ ระบุโฟลเดอร์ที่จะบันทึกไฟล์ทรัพยากร และอื่นๆ

แปลงเอกสาร Word ด้วยข้อมูลไป-กลับ

HTML ไม่สนับสนุนคุณสมบัติทั้งหมดที่มีให้ใน MS Word ดังนั้นเพื่อเลียนแบบเอกสาร Word ใน HTML เราจำเป็นต้องบันทึกข้อมูลเพิ่มเติมที่เรียกว่าข้อมูลไปกลับ ต่อไปนี้เป็นขั้นตอนในการเปิดใช้งานการส่งออกข้อมูลไป-กลับในการแปลง Word เป็น HTML

  • โหลดเอกสาร Word โดยใช้คลาส Document
  • สร้างวัตถุของคลาส HtmlSaveOptions และตั้งค่าคุณสมบัติ HtmlSaveOptions.exportroundtripinformation เป็นจริง
  • แปลงเอกสาร Word เป็น HTML โดยใช้วิธี Document.save() และส่งชื่อไฟล์ HTML และ HtmlSaveOptions เป็นพารามิเตอร์

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการส่งออกข้อมูลไปกลับในการแปลง Word เป็น HTML

import aspose.words as aw

# โหลดเอกสารจากดิสก์
doc = aw.Document("Document.docx")

# เปิดใช้งานข้อมูลไป-กลับ
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True 

# บันทึกเอกสารเป็น HTML
doc.save("Document.html", saveOptions)

Word เป็น HTML: ระบุโฟลเดอร์สำหรับทรัพยากร

คุณยังสามารถระบุโฟลเดอร์ที่คุณต้องการเก็บทรัพยากรทั้งหมด เช่น รูปภาพ ไฟล์ CSS และฟอนต์ สำหรับสิ่งนี้ คุณสามารถใช้คุณสมบัติ HtmlSaveOptions.exportfontresources คุณยังสามารถระบุโฟลเดอร์แยกต่างหากสำหรับฟอนต์และรูปภาพโดยใช้คุณสมบัติ HtmlSaveOptions.fontsfolder และ HtmlSaveOptions.imagesfolder ตามลำดับ ต่อไปนี้เป็นขั้นตอนในการใช้โฟลเดอร์แยกต่างหากเพื่อบันทึกทรัพยากรในการแปลง Word เป็น HTML

  • โหลดเอกสาร Word โดยใช้คลาส Document
  • สร้างวัตถุของคลาส HtmlSaveOptions และตั้งค่าคุณสมบัติ HtmlSaveOptions.exportfontresources เป็นจริง
  • ระบุชื่อโฟลเดอร์ทรัพยากรโดยใช้คุณสมบัติ HtmlSaveOptions.resourcefolder
  • แปลงเอกสาร Word เป็น HTML โดยใช้วิธี Document.save() และส่งชื่อไฟล์ HTML และ HtmlSaveOptions เป็นพารามิเตอร์

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีระบุโฟลเดอร์ทรัพยากรในการแปลง Word เป็น HTML

import aspose.words as aw

# โหลดเอกสารจากดิสก์
doc = aw.Document("Document.docx")

# ระบุโฟลเดอร์ทรัพยากร
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"

# บันทึกเอกสารเป็น HTML
doc.save("Document.html", saveOptions)

รับใบอนุญาต API ฟรี

คุณสามารถ รับใบอนุญาตชั่วคราว เพื่อใช้ Aspose.Words for Python ได้โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแปลงเอกสาร Word เป็น HTML โดยใช้ Python นอกจากนี้ คุณได้เห็นวิธีปรับแต่งการแปลง Word เป็น HTML แบบไดนามิก นอกจากนี้ คุณสามารถสำรวจคุณสมบัติอื่นๆ ของ Aspose.Words for Python โดยใช้ เอกสารประกอบ นอกจากนี้ คุณสามารถถามคำถามผ่าน ฟอรัม ของเรา

ดูสิ่งนี้ด้วย

ข้อมูล: คุณอาจสนใจ Python API อื่น (Aspose.Slides for Python ผ่าน NET) ที่ให้คุณ แปลงงานนำเสนอเป็นภาพ และ นำเข้าภาพไปยังงานนำเสนอ