فرمت HTML محبوب است زیرا تقریباً در تمام محیط های رایانه پشتیبانی می شود. تبدیل WORD به HTML یا MHTML در سناریوهایی مانند زمانی که نیاز دارید چنین فایلی را در یک برنامه وب با استفاده از C++ نمایش دهید مفید است. Aspose.Words for C++ API به دلیل ویژگی ها و کارایی آن بهترین انتخاب است. می توانید برنامه های ++C خود را با قابلیت تبدیل فایل های Microsoft Word (DOC/DOCX) به فرمت HTML یا MHTML غنی کنید. در زیر یک طرح کلی از این مقاله است که در آن به بررسی جزئیات تبدیل Word خواهیم پرداخت:

C++ Microsoft Word Files Converter API – نصب

برای تبدیل فایل های Microsoft Word (DOCX/DOC) باید Aspose.Words برای C++ API را نصب کنیم. می توانید به راحتی API را از گالری NuGet نصب کنید یا با دستور زیر روی کنسول نصب کنید.

Install-Package Aspose.Words.Cpp -Version 20.8.0

با استفاده از C++ Word (DOCX/DOC) را به HTML تبدیل کنید

تبدیل کلمه به HTML زمانی مفید است که می خواهید مطالب را به منظور نمایش آن در مرورگر رندر کنید. برنامه های ++C شما می توانند با مراحل زیر به سرعت تبدیل را انجام دهند:

  1. فایل word منبع را بارگیری کنید
  2. سند را با فرمت HTML ذخیره کنید

کد زیر نحوه تبدیل کلمه به HTML با استفاده از C++ را نشان می دهد:

// بارگیری سند از
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// سند word را در قالب HTML ذخیره کنید
doc->Save(u"Document_out.html", SaveFormat::Html);

تبدیل Word به HTML با فونت های جاسازی شده با استفاده از C++

یک فایل word (DOCX/DOC) ممکن است حاوی فونت های سفارشی باشد که ممکن است در برخی از سیستم عامل ها پشتیبانی نشود. در چنین مواردی، فونت ممکن است در نتایج خروجی آشفته به نظر برسد. با این حال، Aspose.Words for C++ API به شما امکان می دهد منابع فونت را با استفاده از رمزگذاری Base64 در HTML جاسازی کنید. می توانید ویژگی ExportFontsAsBase64 را تنظیم کنید که فونت ها را در فایل HTML خروجی جاسازی کند. برای دستیابی به این الزامات باید مراحل زیر را دنبال کنید:

  1. فایل منبع DOCX را بارگیری کنید
  2. ویژگی ExportFontsAsBase64 را تنظیم کنید
  3. فایل HTML خروجی را ذخیره کنید

قطعه کد زیر نحوه تبدیل Word به HTML با فونت های Embedded را با استفاده از C++ نشان می دهد:

// فایل منبع DOCX را بارگیری کنید
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// شی HtmlSaveOptions را راه اندازی کنید
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// HTML خروجی را ذخیره کنید
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

علاوه بر این، اگر فایل HTML را با Notepad ویرایش کنید یا کد منبع را در مرورگر مشاهده کنید، می توانید فونت های Base64 را که در فایل تعبیه شده است، مشاهده کنید. تصویر زیر نمونه ای از فایل HTML خروجی را نشان می دهد:

تبدیل Word به HTML

تبدیل Word به HTML با اطلاعات رفت و برگشت در C++

اسناد Microsoft Word می توانند حاوی اطلاعات و ویژگی های زیادی باشند که در غیر این صورت در قالب فایل HTML پشتیبانی نمی شوند. گاهی اوقات لازم است Word را به HTML و سپس به فرمت Word تبدیل کنید. برای اطمینان از حداکثر وفاداری بین این تبدیل‌ها، برخی از اطلاعات، که به عنوان “اطلاعات رفت و برگشت” شناخته می‌شوند، می‌توانند توسط Aspose.Words برای C++ API ذخیره شوند. اجازه دهید مراحل زیر را برای آزمایش چنین تبدیلی دنبال کنیم:

  1. فایل منبع DOCX را بارگیری کنید
  2. ExportRoundtripInformation را روی true تنظیم کنید
  3. فایل HTML خروجی را ذخیره کنید

قطعه کد زیر نحوه تبدیل Word به HTML با اطلاعات رفت و برگشت را با استفاده از C++ نشان می دهد:

// فایل ورودی DOCX را بارگیری کنید
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// HtmlSaveOptions را تنظیم کنید
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// ذخیره فایل HTML خروجی        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

تبدیل Word به MHTML در ++C

فرمت فایل MHTML محبوب است زیرا حاوی تمام محتویات یک فایل خروجی است. می توانید فایل Word (DOCX/DOC) را با استفاده از C++ به فرمت MHTML با مراحل زیر تبدیل کنید:

  1. فایل منبع DOCX را بارگیری کنید
  2. خروجی را در قالب MHTML ذخیره کنید

قطعه کد زیر نحوه تبدیل Word به MHTML را با استفاده از C++ نشان می دهد:

// سند را در Aspose.Words بارگذاری کنید.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// خروجی را در قالب MHTML ذخیره کنید.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

نتیجه

ما یاد گرفته ایم که چگونه Word (DOCX/DOC) را با گزینه های مختلف به HTML یا MHTML تبدیل کنیم. چندین ویژگی مانند ذخیره اطلاعات رفت و برگشت یا جاسازی فونت ها به عنوان منابع Base64 نیز به تفصیل مورد بحث قرار گرفته است. با این حال، در صورت وجود هرگونه سوال، لطفاً از طریق [تالار گفتمان پشتیبانی رایگان] با ما تماس بگیرید.

همچنین ببینید