تبدیل Word DOC DOCX به HTML MHTML

این مقاله نحوه تبدیل اسناد Word DOC DOCX به HTML یا MHTML با استفاده از C# یا VB.NET را پوشش می‌دهد. Aspose.Words for .NET API را می توان برای انجام این تبدیل به راحتی استفاده کرد. تبدیل اسناد Microsoft Word یک مورد استفاده محبوب است، بنابراین گزینه های مختلف توسط API پشتیبانی می شوند. می توانید نگاهی به سرفصل هایی که در این مقاله به آنها پرداخته شده است بیاندازید:

C# Word به HTML یا MHTML Converter API

Aspose.Words for .NET API به طور ویژه برای کار با فرمت های فایل پشتیبانی شده مایکروسافت ورد طراحی شده است. می توانید با دانلود API از بخش New Releases یا با نصب آن از NuGet با استفاده از دستور زیر، یک فایل DOCX یا DOC را به فرمت فایل HTML یا MHTML تبدیل کنید:

Install-Package Aspose.Words -Version 20.9.0

تبدیل Word DOC یا DOCX به HTML در سی شارپ

شما می توانید یک سند word (DOC/DOCX) را به صورت برنامه نویسی در برنامه های NET با استفاده از C# یا VB.NET به یک صفحه وب HTML تبدیل کنید. برای تبدیل باید مراحل زیر را دنبال کنید:

  1. سند word ورودی DOCX را بارگیری کنید
  2. نمونه ای از HtmlSaveOptions را راه اندازی کنید
  3. فایل HTML خروجی را ذخیره کنید

قطعه کد زیر این مراحل را دنبال می کند و نحوه تبدیل DOC/DOCX به HTML را با استفاده از C# یا VB.NET نشان می دهد:

// سند را از دیسک بارگیری کنید.
Document doc = new Document(dataDir + "Test File.docx");

// HtmlSaveOptions را تنظیم کنید
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// سند را در HTML ذخیره کنید
doc.Save(dataDir + "Document.html", options);

تبدیل Word DOC یا DOCX به HTML با اطلاعات رفت و برگشت در سی شارپ

برخی از اطلاعات اضافی در طول تبدیل Word به HTML ذخیره می شود. این اطلاعات به عنوان اطلاعات رفت و برگشت شناخته می شود و برای سناریوهایی که فایل HTML تبدیل شده دوباره به عنوان یک سند word ارائه می شود مفید است. برای تبدیل DOC/DOCX به HTML با استفاده از C# می توانید این مراحل را دنبال کنید:

  1. سند word ورودی را بارگیری کنید
  2. ExportRoundtripInformation را روی true تنظیم کنید
  3. فایل HTML خروجی را ذخیره کنید

قطعه کد زیر نحوه تبدیل فایل Word DOC/DOCX به HTML با اطلاعات رفت و برگشت را با استفاده از C# یا VB.NET توضیح می دهد:

// سند را از دیسک بارگیری کنید.
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// ویژگی HtmlSaveOptions.ExportRoundtripInformation را مشخص می کند
// آیا هنگام ذخیره در HTML، MHTML یا EPUB، اطلاعات رفت و برگشت را بنویسید.
// مقدار پیش‌فرض برای HTML درست و برای MHTML و EPUB نادرست است.
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

تبدیل Word DOC یا DOCX به MHTML در سی شارپ

زمانی که به یک فایل HTML با تصاویر و فونت های جاسازی شده نیاز دارید، فرمت فایل MHTML قابل ذکر است. با انجام مراحل زیر می توانید سند Word (DOC/DOCX) را به MHTML تبدیل کنید:

  1. فایل منبع DOC/DOCX را بارگیری کنید
  2. SaveFormat را روی MHTML تنظیم کنید

قطعه کد زیر نحوه تبدیل یک سند word (DOC/DOCX) به MHML را با استفاده از C# یا VB.NET نشان می دهد:

// سند را از دیسک بارگیری کنید.
Document doc = new Document(dataDir + "Test File.docx");

// HtmlSaveOptions را تنظیم کنید
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// سند را در MHTML ذخیره کنید
doc.Save(dataDir + "Document.mhtml", options);

نتیجه

در این مقاله به نحوه تبدیل اسناد word به فایل های HTML یا MHTML در سی شارپ بدون نیاز به نصب اپلیکیشن Microsoft Word پرداخته ایم. علاوه بر این، با مثال‌ها و مراحل دقیق فراخوانی API برای صادرات اسناد Word به فرمت‌های فایل مورد نیاز خود را یاد گرفته‌اید. علاوه بر این، می‌توانید به مرجع API و Documentation نگاهی بیندازید. علاوه بر این، می توانید به ما بنویسید و در مورد هر چیزی در تالار گفتمان پشتیبانی رایگان بپرسید.

همچنین ببینید