
บทความนี้กล่าวถึงวิธีแปลงเอกสาร Word DOC DOCX เป็น HTML หรือ MHTML โดยใช้ C# หรือ VB.NET Aspose.Words for .NET สามารถใช้ API เพื่อทำการแปลงนี้ได้อย่างง่ายดาย การแปลงเอกสาร Microsoft Word เป็นกรณีการใช้งานยอดนิยม ดังนั้น API จึงรองรับตัวเลือกต่างๆ คุณสามารถดูหัวข้อที่ครอบคลุมในบทความนี้:
- C# Word (DOC/DOCX) เป็น HTML หรือ MHTML Converter API
- แปลง Word DOC หรือ DOCX เป็นเว็บเพจ HTML ใน C#
- Word เป็น HTML พร้อมข้อมูลไปกลับใน C#
- แปลง Word DOC หรือ DOCX เป็น MHTML ใน C#
C# Word เป็น HTML หรือ MHTML Converter API
Aspose.Words for .NET API ได้รับการออกแบบมาเป็นพิเศษเพื่อทำงานกับรูปแบบไฟล์ที่รองรับ Microsoft Word คุณสามารถแปลงไฟล์ DOCX หรือ DOC เป็นรูปแบบไฟล์ HTML หรือ MHTML ได้โดยการดาวน์โหลด API จากส่วน New Releases หรือโดยการติดตั้งจาก NuGet โดยใช้คำสั่งด้านล่าง:
Install-Package Aspose.Words -Version 20.9.0
แปลง Word DOC หรือ DOCX เป็น HTML ใน C#
คุณสามารถแปลงเอกสารเวิร์ด (DOC/DOCX) เป็นเว็บเพจ HTML ได้อย่างมีประสิทธิภาพในแอปพลิเคชัน .NET โดยใช้ C# หรือ VB.NET คุณต้องทำตามขั้นตอนด้านล่างสำหรับการแปลง:
- โหลดเอกสารคำ DOCX ที่ป้อนเข้า
- เริ่มต้นอินสแตนซ์ของ HtmlSaveOptions
- บันทึกไฟล์ HTML เอาต์พุต
ข้อมูลโค้ดต่อไปนี้ทำตามขั้นตอนเหล่านี้และแสดงวิธีการแปลง DOC/DOCX เป็น HTML โดยใช้ C# หรือ VB.NET:
// โหลดเอกสารจากดิสก์
Document doc = new Document(dataDir + "Test File.docx");
// ตั้งค่า HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;
// บันทึกเอกสารเป็น HTML
doc.Save(dataDir + "Document.html", options);
แปลง Word DOC หรือ DOCX เป็น HTML พร้อมข้อมูลไป-กลับใน C#
ข้อมูลเพิ่มเติมบางอย่างจะถูกบันทึกระหว่างการแปลง Word เป็น HTML ข้อมูลนี้เรียกว่าข้อมูลไป-กลับและมีประโยชน์สำหรับสถานการณ์ที่ไฟล์ HTML ที่แปลงแล้วแสดงผลเป็นเอกสารคำอีกครั้ง คุณสามารถทำตามขั้นตอนเหล่านี้เพื่อแปลง DOC/DOCX เป็น HTML โดยใช้ C#:
- โหลดเอกสารคำที่ป้อน
- ตั้งค่า ExportRoundtripInformation เป็นจริง
- บันทึกไฟล์ HTML เอาต์พุต
ข้อมูลโค้ดด้านล่างอธิบายวิธีการแปลงไฟล์ Word DOC/DOCX เป็น HTML พร้อมข้อมูลไป-กลับโดยใช้ C# หรือ VB.NET:
// โหลดเอกสารจากดิสก์
Document doc = new Document(dataDir + "Test File (doc).docx");
HtmlSaveOptions options = new HtmlSaveOptions();
// ระบุคุณสมบัติ HtmlSaveOptions.ExportRoundtripInformation
// ว่าจะเขียนข้อมูลไปกลับเมื่อบันทึกเป็น HTML, MHTML หรือ EPUB
// ค่าเริ่มต้นเป็นจริงสำหรับ HTML และเท็จสำหรับ MHTML และ EPUB
options.ExportRoundtripInformation = true;
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);
แปลง Word DOC หรือ DOCX เป็น MHTML ใน C#
รูปแบบไฟล์ MHTML เป็นสิ่งที่ควรค่าแก่การกล่าวถึงเมื่อคุณต้องการไฟล์ HTML ไฟล์เดียวที่มีรูปภาพและฟอนต์ฝังอยู่ คุณสามารถแปลงเอกสาร Word (DOC/DOCX) เป็น MHTML ด้วยขั้นตอนด้านล่าง:
- โหลดซอร์สไฟล์ DOC/DOCX
- ตั้งค่า SaveFormat เป็น MHTML
ข้อมูลโค้ดด้านล่างแสดงวิธีการแปลงเอกสารคำ (DOC/DOCX) เป็น MHML โดยใช้ C# หรือ VB.NET:
// โหลดเอกสารจากดิสก์
Document doc = new Document(dataDir + "Test File.docx");
// ตั้งค่า HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;
// บันทึกเอกสารลงใน MHTML
doc.Save(dataDir + "Document.mhtml", options);
บทสรุป
ในบทความนี้ เราได้พูดถึงวิธีการแปลงเอกสาร word เป็นไฟล์ HTML หรือ MHTML ในภาษา C# โดยไม่จำเป็นต้องติดตั้งแอปพลิเคชัน Microsoft Word นอกจากนี้ คุณได้เรียนรู้พร้อมตัวอย่างและขั้นตอนโดยละเอียดเพื่อทำการเรียก API เพื่อส่งออกเอกสาร Word เป็นรูปแบบไฟล์ที่คุณต้องการ นอกจากนี้ คุณสามารถดู การอ้างอิง API และ เอกสารประกอบ ยิ่งไปกว่านั้น คุณสามารถตอบกลับมาหาเราและสอบถามเกี่ยวกับอะไรก็ได้ที่ ฟอรัมสนับสนุนฟรี