Formát HTML je oblíbený, protože je podporován téměř ve všech počítačových prostředích. Konverze WORD do HTML nebo MHTML je užitečná ve scénářích, jako když potřebujete zobrazit takový soubor ve webové aplikaci pomocí C++. Aspose.Words for C++ API je nejlepší volbou kvůli svým funkcím a účinnosti. Své C++ aplikace můžete obohatit o schopnost převádět soubory Microsoft Word (DOC/DOCX) do formátu HTML nebo MHTML. Následuje nástin tohoto článku, kde podrobně prozkoumáme převod Wordu:

C++ Microsoft Word Files Converter API – instalace

Potřebujeme nainstalovat Aspose.Words for C++ API pro převod souborů Microsoft Word (DOCX/DOC). API můžete snadno nainstalovat z galerie NuGet nebo jej nainstalovat pomocí následujícího příkazu na konzoli.

Install-Package Aspose.Words.Cpp -Version 20.8.0

Převeďte Word (DOCX/DOC) do HTML pomocí C++

Převod Word do HTML je užitečný, když chcete vykreslit obsah, abyste jej mohli zobrazit v prohlížeči. Vaše aplikace C++ mohou rychle provést převod pomocí následujících kroků:

  1. Načíst zdrojový soubor word
  2. Uložte dokument ve formátu HTML

Níže uvedený kód ukazuje, jak převést slovo do HTML pomocí C++:

// Vložte dokument z
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Uložte dokument aplikace Word ve formátu HTML
doc->Save(u"Document_out.html", SaveFormat::Html);

Převeďte Word do HTML s vloženými fonty pomocí C++

Soubor aplikace Word (DOCX/DOC) může obsahovat nějaké vlastní písmo, které nemusí být na některých platformách podporováno. V takových případech se může písmo ve výsledcích výstupu jevit jako zkomolené. Aspose.Words for C++ API však umožňuje vložit prostředky písem do HTML pomocí kódování Base64. Můžete nastavit vlastnost ExportFontsAsBase64, která vloží písma do výstupního souboru HTML. Chcete-li splnit tyto požadavky, musíte provést následující kroky:

  1. Načtěte zdrojový soubor DOCX
  2. Nastavte vlastnost ExportFontsAsBase64
  3. Uložte výstupní soubor HTML

Následující úryvek kódu ukazuje, jak převést Word do HTML s vloženými fonty pomocí C++:

// Načtěte zdrojový soubor DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// Inicializujte objekt HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// Uložit výstupní HTML
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Navíc, pokud upravíte soubor HTML pomocí programu Poznámkový blok nebo uvidíte zdrojový kód v prohlížeči, můžete si všimnout písem Base64 vložených do souboru. Následující snímek obrazovky ukazuje příklad z výstupního souboru HTML:

Převést Word do HTML

Převeďte Word do HTML pomocí Round-Trip Information v C++

Dokumenty Microsoft Word mohou obsahovat mnoho informací a funkcí, které jinak nejsou podporovány ve formátu souboru HTML. Někdy je potřeba převést Word do HTML a pak zpět do formátu Word. Pro zajištění maximální věrnosti mezi těmito převody lze některé informace, známé jako „informace o zpáteční cestě“, dodatečně uložit pomocí Aspose.Words for C++ API. Při testování takové konverze postupujte podle následujících kroků:

  1. Načtěte zdrojový soubor DOCX
  2. Nastavte ExportRoundtripInformation na hodnotu true
  3. Uložte výstupní soubor HTML

Níže uvedený úryvek kódu ukazuje, jak převést Word do HTML s oboustrannými informacemi pomocí C++:

// Načtěte vstupní soubor DOCX
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// Nastavte možnosti HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Uložit výstupní HTML soubor        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Převést Word na MHTML v C++

Formát souboru MHTML je populární, protože obsahuje veškerý obsah v jednom výstupním souboru. Soubor Word (DOCX/DOC) můžete převést do formátu MHTML pomocí C++ pomocí následujících kroků:

  1. Načtěte zdrojový soubor DOCX
  2. Uložte výstup ve formátu MHTML

Níže uvedený fragment kódu ukazuje, jak převést Word na MHTML pomocí C++:

// Vložte dokument do Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Uložte výstup ve formátu MHTML.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

Závěr

Naučili jsme se, jak převést Word (DOCX/DOC) do HTML nebo MHTML s různými možnostmi. Podrobně je také popsáno několik funkcí, jako je ukládání informací o zpáteční cestě nebo vkládání písem jako zdrojů Base64. V případě jakýchkoli dotazů nás však neváhejte kontaktovat prostřednictvím Free Support Forum.

Viz také