Формат HTML популярен, потому что он поддерживается практически во всех компьютерных средах. Преобразование WORD в HTML или MHTML полезно в таких сценариях, как когда вам нужно отобразить такой файл в веб-приложении, использующем C++. Aspose.Words for C++ API — лучший выбор из-за его возможностей и эффективности. Вы можете обогатить свои приложения C++ возможностью конвертировать файлы Microsoft Word (DOC/DOCX) в формат HTML или MHTML. Ниже приведен план этой статьи, в которой мы подробно рассмотрим преобразование Word:

C++ API конвертера файлов Microsoft Word — установка

Нам необходимо установить Aspose.Words for C++ API для преобразования файлов Microsoft Word (DOCX/DOC). Вы можете легко установить API из галереи NuGet или установить его с помощью следующей команды в консоли.

Install-Package Aspose.Words.Cpp -Version 20.8.0

Преобразование Word (DOCX/DOC) в HTML с помощью C++

Преобразование Word в HTML полезно, когда вы хотите отобразить содержимое, чтобы отобразить его в браузере. Ваши приложения C++ могут быстро выполнить преобразование, выполнив следующие действия:

  1. Загрузить исходный текстовый файл
  2. Сохраните документ в формате HTML

В приведенном ниже коде показано, как преобразовать слово в HTML с помощью C++:

// Загрузите документ из
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Сохраните документ Word в формате HTML.
doc->Save(u"Document_out.html", SaveFormat::Html);

Преобразование Word в HTML со встроенными шрифтами с помощью C++

Файл Word (DOCX/DOC) может содержать пользовательский шрифт, который может не поддерживаться на некоторых платформах. В таких случаях шрифт может отображаться искаженным в результатах вывода. Однако Aspose.Words for C++ API позволяет встраивать ресурсы шрифта в HTML, используя кодировку Base64. Вы можете установить свойство ExportFontsAsBase64, которое будет встраивать шрифты в выходной файл HTML. Для выполнения этих требований необходимо выполнить следующие шаги:

  1. Загрузить исходный файл DOCX
  2. Установите свойство ExportFontsAsBase64
  3. Сохраните выходной HTML-файл

В следующем фрагменте кода показано, как преобразовать Word в HTML со встроенными шрифтами с помощью C++:

// Загрузить исходный файл DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// Инициализировать объект HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// Сохранить выходной HTML
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Более того, если вы отредактируете файл HTML с помощью Блокнота или просмотрите исходный код в браузере, вы сможете заметить встроенные в файл шрифты Base64. На следующем снимке экрана показан пример из выходного HTML-файла:

Преобразование Word в HTML

Преобразование Word в HTML с возвратной информацией в C++

Документы Microsoft Word могут содержать много информации и функций, которые иначе не поддерживаются в формате файлов HTML. Иногда вам нужно преобразовать Word в HTML, а затем обратно в формат Word. Чтобы обеспечить максимальную точность между этими преобразованиями, некоторая информация, известная как «информация о передаче туда и обратно», может быть дополнительно сохранена с помощью Aspose.Words for C++ API. Давайте выполним следующие шаги, чтобы проверить такое преобразование:

  1. Загрузить исходный файл DOCX
  2. Установите для параметра ExportRoundtripInformation значение true.
  3. Сохраните выходной HTML-файл

Фрагмент кода ниже показывает, как преобразовать Word в HTML с двусторонней информацией с помощью C++:

// Загрузить входной файл DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// Установить хтмлсавеоптионс
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Сохранить выходной HTML-файл        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Преобразование Word в MHTML на C++

Формат файла MHTML популярен, поскольку он содержит все содержимое в одном выходном файле. Вы можете преобразовать файл Word (DOCX/DOC) в формат MHTML с помощью C++, выполнив следующие действия:

  1. Загрузить исходный файл DOCX
  2. Сохранить вывод в формате MHTML

Фрагмент кода ниже показывает, как преобразовать Word в MHTML с помощью C++:

// Загрузите документ в Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Сохраните вывод в формате MHTML.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

Вывод

Мы научились конвертировать Word (DOCX/DOC) в HTML или MHTML с различными параметрами. Также подробно обсуждаются некоторые функции, такие как сохранение информации о круговых поездках или встраивание шрифтов в виде ресурсов Base64. Тем не менее, если у вас возникнут какие-либо вопросы, свяжитесь с нами через Форум бесплатной поддержки.

Смотрите также