Формат HTML популярен, потому что он поддерживается практически во всех компьютерных средах. Преобразование WORD в HTML или MHTML полезно в таких сценариях, как когда вам нужно отобразить такой файл в веб-приложении, использующем C++. Aspose.Words for C++ API — лучший выбор из-за его возможностей и эффективности. Вы можете обогатить свои приложения C++ возможностью конвертировать файлы Microsoft Word (DOC/DOCX) в формат HTML или MHTML. Ниже приведен план этой статьи, в которой мы подробно рассмотрим преобразование Word:
- C++ API конвертера файлов Microsoft Word — установка
- Преобразование Word в HTML с помощью C++
- Преобразование Word в HTML со встроенными шрифтами с помощью C++
- Преобразование Word в HTML с возвратной информацией в C++
- Преобразование Word в MHTML на C++
C++ API конвертера файлов Microsoft Word — установка
Нам необходимо установить Aspose.Words for C++ API для преобразования файлов Microsoft Word (DOCX/DOC). Вы можете легко установить API из галереи NuGet или установить его с помощью следующей команды в консоли.
Install-Package Aspose.Words.Cpp -Version 20.8.0
Преобразование Word (DOCX/DOC) в HTML с помощью C++
Преобразование Word в HTML полезно, когда вы хотите отобразить содержимое, чтобы отобразить его в браузере. Ваши приложения C++ могут быстро выполнить преобразование, выполнив следующие действия:
- Загрузить исходный текстовый файл
- Сохраните документ в формате HTML
В приведенном ниже коде показано, как преобразовать слово в HTML с помощью C++:
// Загрузите документ из
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");
// Сохраните документ Word в формате HTML.
doc->Save(u"Document_out.html", SaveFormat::Html);
Преобразование Word в HTML со встроенными шрифтами с помощью C++
Файл Word (DOCX/DOC) может содержать пользовательский шрифт, который может не поддерживаться на некоторых платформах. В таких случаях шрифт может отображаться искаженным в результатах вывода. Однако Aspose.Words for C++ API позволяет встраивать ресурсы шрифта в HTML, используя кодировку Base64. Вы можете установить свойство ExportFontsAsBase64, которое будет встраивать шрифты в выходной файл HTML. Для выполнения этих требований необходимо выполнить следующие шаги:
- Загрузить исходный файл DOCX
- Установите свойство ExportFontsAsBase64
- Сохраните выходной HTML-файл
В следующем фрагменте кода показано, как преобразовать Word в HTML со встроенными шрифтами с помощью C++:
// Загрузить исходный файл DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");
// Инициализировать объект HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
// Сохранить выходной HTML
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);
Более того, если вы отредактируете файл HTML с помощью Блокнота или просмотрите исходный код в браузере, вы сможете заметить встроенные в файл шрифты Base64. На следующем снимке экрана показан пример из выходного HTML-файла:
Преобразование Word в HTML с возвратной информацией в C++
Документы Microsoft Word могут содержать много информации и функций, которые иначе не поддерживаются в формате файлов HTML. Иногда вам нужно преобразовать Word в HTML, а затем обратно в формат Word. Чтобы обеспечить максимальную точность между этими преобразованиями, некоторая информация, известная как «информация о передаче туда и обратно», может быть дополнительно сохранена с помощью Aspose.Words for C++ API. Давайте выполним следующие шаги, чтобы проверить такое преобразование:
- Загрузить исходный файл DOCX
- Установите для параметра ExportRoundtripInformation значение true.
- Сохраните выходной HTML-файл
Фрагмент кода ниже показывает, как преобразовать Word в HTML с двусторонней информацией с помощью C++:
// Загрузить входной файл DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");
// Установить хтмлсавеоптионс
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
// Сохранить выходной HTML-файл
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);
Преобразование Word в MHTML на C++
Формат файла MHTML популярен, поскольку он содержит все содержимое в одном выходном файле. Вы можете преобразовать файл Word (DOCX/DOC) в формат MHTML с помощью C++, выполнив следующие действия:
- Загрузить исходный файл DOCX
- Сохранить вывод в формате MHTML
Фрагмент кода ниже показывает, как преобразовать Word в MHTML с помощью C++:
// Загрузите документ в Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");
// Сохраните вывод в формате MHTML.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);
Вывод
Мы научились конвертировать Word (DOCX/DOC) в HTML или MHTML с различными параметрами. Также подробно обсуждаются некоторые функции, такие как сохранение информации о круговых поездках или встраивание шрифтов в виде ресурсов Base64. Тем не менее, если у вас возникнут какие-либо вопросы, свяжитесь с нами через Форум бесплатной поддержки.