Формат HTML популярний, оскільки він підтримується майже в усіх комп’ютерних середовищах. Конвертація WORD у HTML або MHTML корисна в сценаріях, наприклад, коли вам потрібно відобразити такий файл у веб-програмі за допомогою C++. Aspose.Words for C++ API є найкращим вибором через його функції та ефективність. Ви можете збагатити свої програми C++ можливістю конвертувати файли Microsoft Word (DOC/DOCX) у формат HTML або MHTML. Нижче наведено план цієї статті, у якій ми детально розглянемо перетворення Word:

C++ Microsoft Word Files Converter API – встановлення

Нам потрібно встановити Aspose.Words for C++ API для конвертації файлів Microsoft Word (DOCX/DOC). Ви можете легко встановити API з галереї NuGet або встановити його за допомогою такої команди на консолі.

Install-Package Aspose.Words.Cpp -Version 20.8.0

Перетворення Word (DOCX/DOC) на HTML за допомогою C++

Перетворення Word у HTML корисно, коли ви хочете відобразити вміст, щоб відобразити його у браузері. Ваші програми C++ можуть швидко виконати перетворення за допомогою таких кроків:

  1. Завантажити вихідний файл word
  2. Збережіть документ у форматі HTML

Наведений нижче код показує, як конвертувати Word у HTML за допомогою C++:

// Завантажте документ із
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Збережіть документ word у форматі HTML
doc->Save(u"Document_out.html", SaveFormat::Html);

Перетворіть Word на HTML за допомогою вбудованих шрифтів за допомогою C++

Файл Word (DOCX/DOC) може містити власний шрифт, який може не підтримуватися на деяких платформах. У таких випадках у результатах виводу шрифт може виглядати спотвореним. Однак API Aspose.Words for C++ дозволяє вставляти ресурси шрифтів у HTML за допомогою кодування Base64. Ви можете встановити властивість ExportFontsAsBase64, яка вставлятиме шрифти у вихідний файл HTML. Щоб досягти цих вимог, потрібно виконати наведені нижче дії.

  1. Завантажити вихідний файл DOCX
  2. Установіть властивість ExportFontsAsBase64.
  3. Збережіть вихідний файл HTML

Наступний фрагмент коду показує, як конвертувати Word у HTML із вбудованими шрифтами за допомогою C++:

// Завантажити вихідний файл DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// Ініціалізація об'єкта HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// Зберегти вихідний HTML
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Крім того, якщо ви редагуєте файл HTML за допомогою Блокнота або переглядаєте вихідний код у браузері, ви можете помітити шрифти Base64, вбудовані у файл. На наступному знімку екрана показано приклад вихідного файлу HTML:

Перетворення Word на HTML

Перетворіть Word на HTML за допомогою інформації в обидва кінці на C++

Документи Microsoft Word можуть містити багато інформації та функцій, які інакше не підтримуються у форматі файлу HTML. Іноді потрібно конвертувати Word у HTML, а потім знову у формат Word. Щоб забезпечити максимальну точність між цими перетвореннями, деяка інформація, відома як «інформація про зворотний шлях», може бути додатково збережена Aspose.Words for C++ API. Щоб перевірити таке перетворення, виконайте наступні кроки:

  1. Завантажити вихідний файл DOCX
  2. Установіть для ExportRoundtripInformation значення true
  3. Збережіть вихідний файл HTML

У наведеному нижче фрагменті коду показано, як конвертувати Word у HTML із інформацією про зворотний зв’язок за допомогою C++:

// Завантажити вхідний файл DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// Встановіть HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Зберегти вихідний файл HTML        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Перетворення Word на MHTML на C++

Формат файлу MHTML популярний, оскільки містить увесь вміст в одному вихідному файлі. Ви можете конвертувати файл Word (DOCX/DOC) у формат MHTML за допомогою C++, виконавши такі дії:

  1. Завантажити вихідний файл DOCX
  2. Збережіть результат у форматі MHTML

Наведений нижче фрагмент коду показує, як конвертувати Word у MHTML за допомогою C++:

// Завантажте документ в Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Збережіть результат у форматі MHTML.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

Висновок

Ми навчилися конвертувати Word (DOCX/DOC) у HTML або MHTML із різними параметрами. Також детально обговорюються деякі функції, такі як збереження інформації про зворотний шлях або вбудовування шрифтів як ресурсів Base64. Однак у разі будь-яких запитань зв’яжіться з нами через безкоштовний форум підтримки.

Дивись також