O formato HTML é popular porque é suportado em quase todos os ambientes de computador. A conversão de WORD para HTML ou MHTML é útil em cenários como quando você precisa exibir esse arquivo em um aplicativo da Web usando C++. Aspose.Words for C++ API é a melhor escolha por causa de seus recursos e eficiência. Você pode enriquecer seus aplicativos C++ com a capacidade de converter arquivos do Microsoft Word (DOC/DOCX) para o formato HTML ou MHTML. A seguir está um esboço deste artigo onde exploraremos a conversão do Word em detalhes:
- API C++ do Conversor de Arquivos do Microsoft Word – Instalação
- Converter Word para HTML usando C++
- Converter Word para HTML com fontes incorporadas usando C++
- Converter Word para HTML com informações de ida e volta em C++
- Converter Word para MHTML em C++
API C++ do Conversor de Arquivos do Microsoft Word – Instalação
Precisamos instalar o Aspose.Words for C++ API para converter arquivos do Microsoft Word (DOCX/DOC). Você pode instalar facilmente a API da galeria NuGet ou instalá-la com o seguinte comando no console.
Install-Package Aspose.Words.Cpp -Version 20.8.0
Converter Word (DOCX/DOC) para HTML usando C++
A conversão de Word para HTML é útil quando você deseja renderizar conteúdo para exibi-lo em um navegador. Seus aplicativos C++ podem realizar a conversão rapidamente com as seguintes etapas:
- Carregar arquivo de palavras de origem
- Salve o documento em formato HTML
O código abaixo mostra como converter word para HTML usando C++:
// Carregue o documento de
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");
// Salve o documento do Word em formato HTML
doc->Save(u"Document_out.html", SaveFormat::Html);
Converter Word para HTML com fontes incorporadas usando C++
Um arquivo de palavras (DOCX/DOC) pode conter alguma fonte personalizada que pode não ser suportada em algumas plataformas. Nesses casos, a fonte pode aparecer distorcida nos resultados de saída. No entanto, Aspose.Words para C++ API permite incorporar os recursos de fonte em HTML usando a codificação Base64. Você pode definir a propriedade ExportFontsAsBase64 que incorporará fontes no arquivo HTML de saída. Você precisa seguir as etapas abaixo para atender a esses requisitos:
- Carregar arquivo DOCX de origem
- Defina a propriedade ExportFontsAsBase64
- Salve o arquivo HTML de saída
O trecho de código a seguir mostra como converter Word em HTML com fontes incorporadas usando C++:
// Carregar arquivo DOCX de origem
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");
// Inicialize o objeto HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
// Salvar HTML de saída
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);
Além disso, se você editar o arquivo HTML com o Bloco de Notas ou visualizar o código-fonte em um navegador, poderá observar as fontes Base64 incorporadas ao arquivo. A captura de tela a seguir mostra um exemplo do arquivo HTML de saída:
Converter Word para HTML com informações de ida e volta em C++
Os documentos do Microsoft Word podem conter muitas informações e recursos que, de outra forma, não são suportados no formato de arquivo HTML. Às vezes você precisa converter Word para HTML e depois voltar para o formato Word. Para garantir a máxima fidelidade entre essas conversões, algumas informações, conhecidas como “informações de ida e volta” podem ser salvas adicionalmente pelo Aspose.Words for C++ API. Vamos seguir os seguintes passos para testar tal conversão:
- Carregar arquivo DOCX de origem
- Defina ExportRoundtripInformation como verdadeiro
- Salve o arquivo HTML de saída
O trecho de código abaixo mostra como converter Word em HTML com informações de ida e volta usando C++:
// Carregar arquivo DOCX de entrada
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");
// Definir HtmlSaveOptions
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
// Salvar arquivo HTML de saída
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);
Converter Word para MHTML em C++
O formato de arquivo MHTML é popular, pois contém todo o conteúdo em um único arquivo de saída. Você pode converter o arquivo do Word (DOCX/DOC) para o formato MHTML usando C++ com as seguintes etapas:
- Carregar arquivo DOCX de origem
- Salvar saída no formato MHTML
O trecho de código abaixo mostra como converter Word para MHTML usando C++:
// Carregue o documento em Aspose.Words.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");
// Salve a saída no formato MHTML.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);
Conclusão
Aprendemos como converter Word (DOCX/DOC) para HTML ou MHTML com diferentes opções. Vários recursos, como salvar informações de ida e volta ou incorporar fontes como recursos Base64, também são discutidos em detalhes. No entanto, em caso de dúvidas, não hesite em contactar-nos através do Free Support Forum.