O formato HTML é popular porque é suportado em quase todos os ambientes de computador. A conversão de WORD para HTML ou MHTML é útil em cenários como quando você precisa exibir esse arquivo em um aplicativo da Web usando C++. Aspose.Words for C++ API é a melhor escolha por causa de seus recursos e eficiência. Você pode enriquecer seus aplicativos C++ com a capacidade de converter arquivos do Microsoft Word (DOC/DOCX) para o formato HTML ou MHTML. A seguir está um esboço deste artigo onde exploraremos a conversão do Word em detalhes:

API C++ do Conversor de Arquivos do Microsoft Word – Instalação

Precisamos instalar o Aspose.Words for C++ API para converter arquivos do Microsoft Word (DOCX/DOC). Você pode instalar facilmente a API da galeria NuGet ou instalá-la com o seguinte comando no console.

Install-Package Aspose.Words.Cpp -Version 20.8.0

Converter Word (DOCX/DOC) para HTML usando C++

A conversão de Word para HTML é útil quando você deseja renderizar conteúdo para exibi-lo em um navegador. Seus aplicativos C++ podem realizar a conversão rapidamente com as seguintes etapas:

  1. Carregar arquivo de palavras de origem
  2. Salve o documento em formato HTML

O código abaixo mostra como converter word para HTML usando C++:

// Carregue o documento de
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Salve o documento do Word em formato HTML
doc->Save(u"Document_out.html", SaveFormat::Html);

Converter Word para HTML com fontes incorporadas usando C++

Um arquivo de palavras (DOCX/DOC) pode conter alguma fonte personalizada que pode não ser suportada em algumas plataformas. Nesses casos, a fonte pode aparecer distorcida nos resultados de saída. No entanto, Aspose.Words para C++ API permite incorporar os recursos de fonte em HTML usando a codificação Base64. Você pode definir a propriedade ExportFontsAsBase64 que incorporará fontes no arquivo HTML de saída. Você precisa seguir as etapas abaixo para atender a esses requisitos:

  1. Carregar arquivo DOCX de origem
  2. Defina a propriedade ExportFontsAsBase64
  3. Salve o arquivo HTML de saída

O trecho de código a seguir mostra como converter Word em HTML com fontes incorporadas usando C++:

// Carregar arquivo DOCX de origem
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// Inicialize o objeto HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// Salvar HTML de saída
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Além disso, se você editar o arquivo HTML com o Bloco de Notas ou visualizar o código-fonte em um navegador, poderá observar as fontes Base64 incorporadas ao arquivo. A captura de tela a seguir mostra um exemplo do arquivo HTML de saída:

Converter Word para HTML

Converter Word para HTML com informações de ida e volta em C++

Os documentos do Microsoft Word podem conter muitas informações e recursos que, de outra forma, não são suportados no formato de arquivo HTML. Às vezes você precisa converter Word para HTML e depois voltar para o formato Word. Para garantir a máxima fidelidade entre essas conversões, algumas informações, conhecidas como “informações de ida e volta” podem ser salvas adicionalmente pelo Aspose.Words for C++ API. Vamos seguir os seguintes passos para testar tal conversão:

  1. Carregar arquivo DOCX de origem
  2. Defina ExportRoundtripInformation como verdadeiro
  3. Salve o arquivo HTML de saída

O trecho de código abaixo mostra como converter Word em HTML com informações de ida e volta usando C++:

// Carregar arquivo DOCX de entrada
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// Definir HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Salvar arquivo HTML de saída        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Converter Word para MHTML em C++

O formato de arquivo MHTML é popular, pois contém todo o conteúdo em um único arquivo de saída. Você pode converter o arquivo do Word (DOCX/DOC) para o formato MHTML usando C++ com as seguintes etapas:

  1. Carregar arquivo DOCX de origem
  2. Salvar saída no formato MHTML

O trecho de código abaixo mostra como converter Word para MHTML usando C++:

// Carregue o documento em Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Salve a saída no formato MHTML.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

Conclusão

Aprendemos como converter Word (DOCX/DOC) para HTML ou MHTML com diferentes opções. Vários recursos, como salvar informações de ida e volta ou incorporar fontes como recursos Base64, também são discutidos em detalhes. No entanto, em caso de dúvidas, não hesite em contactar-nos através do Free Support Forum.

Veja também