แปลง Word DOC DOCX เป็น HTML MHTML

บทความนี้กล่าวถึงวิธีแปลงเอกสาร Word DOC DOCX เป็น HTML หรือ MHTML โดยใช้ C# หรือ VB.NET Aspose.Words for .NET สามารถใช้ API เพื่อทำการแปลงนี้ได้อย่างง่ายดาย การแปลงเอกสาร Microsoft Word เป็นกรณีการใช้งานยอดนิยม ดังนั้น API จึงรองรับตัวเลือกต่างๆ คุณสามารถดูหัวข้อที่ครอบคลุมในบทความนี้:

C# Word เป็น HTML หรือ MHTML Converter API

Aspose.Words for .NET API ได้รับการออกแบบมาเป็นพิเศษเพื่อทำงานกับรูปแบบไฟล์ที่รองรับ Microsoft Word คุณสามารถแปลงไฟล์ DOCX หรือ DOC เป็นรูปแบบไฟล์ HTML หรือ MHTML ได้โดยการดาวน์โหลด API จากส่วน New Releases หรือโดยการติดตั้งจาก NuGet โดยใช้คำสั่งด้านล่าง:

Install-Package Aspose.Words -Version 20.9.0

แปลง Word DOC หรือ DOCX เป็น HTML ใน C#

คุณสามารถแปลงเอกสารเวิร์ด (DOC/DOCX) เป็นเว็บเพจ HTML ได้อย่างมีประสิทธิภาพในแอปพลิเคชัน .NET โดยใช้ C# หรือ VB.NET คุณต้องทำตามขั้นตอนด้านล่างสำหรับการแปลง:

  1. โหลดเอกสารคำ DOCX ที่ป้อนเข้า
  2. เริ่มต้นอินสแตนซ์ของ HtmlSaveOptions
  3. บันทึกไฟล์ HTML เอาต์พุต

ข้อมูลโค้ดต่อไปนี้ทำตามขั้นตอนเหล่านี้และแสดงวิธีการแปลง DOC/DOCX เป็น HTML โดยใช้ C# หรือ VB.NET:

// โหลดเอกสารจากดิสก์
Document doc = new Document(dataDir + "Test File.docx");

// ตั้งค่า HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// บันทึกเอกสารเป็น HTML
doc.Save(dataDir + "Document.html", options);

แปลง Word DOC หรือ DOCX เป็น HTML พร้อมข้อมูลไป-กลับใน C#

ข้อมูลเพิ่มเติมบางอย่างจะถูกบันทึกระหว่างการแปลง Word เป็น HTML ข้อมูลนี้เรียกว่าข้อมูลไป-กลับและมีประโยชน์สำหรับสถานการณ์ที่ไฟล์ HTML ที่แปลงแล้วแสดงผลเป็นเอกสารคำอีกครั้ง คุณสามารถทำตามขั้นตอนเหล่านี้เพื่อแปลง DOC/DOCX เป็น HTML โดยใช้ C#:

  1. โหลดเอกสารคำที่ป้อน
  2. ตั้งค่า ExportRoundtripInformation เป็นจริง
  3. บันทึกไฟล์ HTML เอาต์พุต

ข้อมูลโค้ดด้านล่างอธิบายวิธีการแปลงไฟล์ Word DOC/DOCX เป็น HTML พร้อมข้อมูลไป-กลับโดยใช้ C# หรือ VB.NET:

// โหลดเอกสารจากดิสก์
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// ระบุคุณสมบัติ HtmlSaveOptions.ExportRoundtripInformation
// ว่าจะเขียนข้อมูลไปกลับเมื่อบันทึกเป็น HTML, MHTML หรือ EPUB
// ค่าเริ่มต้นเป็นจริงสำหรับ HTML และเท็จสำหรับ MHTML และ EPUB
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

แปลง Word DOC หรือ DOCX เป็น MHTML ใน C#

รูปแบบไฟล์ MHTML เป็นสิ่งที่ควรค่าแก่การกล่าวถึงเมื่อคุณต้องการไฟล์ HTML ไฟล์เดียวที่มีรูปภาพและฟอนต์ฝังอยู่ คุณสามารถแปลงเอกสาร Word (DOC/DOCX) เป็น MHTML ด้วยขั้นตอนด้านล่าง:

  1. โหลดซอร์สไฟล์ DOC/DOCX
  2. ตั้งค่า SaveFormat เป็น MHTML

ข้อมูลโค้ดด้านล่างแสดงวิธีการแปลงเอกสารคำ (DOC/DOCX) เป็น MHML โดยใช้ C# หรือ VB.NET:

// โหลดเอกสารจากดิสก์
Document doc = new Document(dataDir + "Test File.docx");

// ตั้งค่า HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// บันทึกเอกสารลงใน MHTML
doc.Save(dataDir + "Document.mhtml", options);

บทสรุป

ในบทความนี้ เราได้พูดถึงวิธีการแปลงเอกสาร word เป็นไฟล์ HTML หรือ MHTML ในภาษา C# โดยไม่จำเป็นต้องติดตั้งแอปพลิเคชัน Microsoft Word นอกจากนี้ คุณได้เรียนรู้พร้อมตัวอย่างและขั้นตอนโดยละเอียดเพื่อทำการเรียก API เพื่อส่งออกเอกสาร Word เป็นรูปแบบไฟล์ที่คุณต้องการ นอกจากนี้ คุณสามารถดู การอ้างอิง API และ เอกสารประกอบ ยิ่งไปกว่านั้น คุณสามารถตอบกลับมาหาเราและสอบถามเกี่ยวกับอะไรก็ได้ที่ ฟอรัมสนับสนุนฟรี

ดูสิ่งนี้ด้วย