
Em vários cenários, pode ser necessário exibir o conteúdo de arquivos Word DOCX em suas aplicações web ou desktop. Uma das opções adequadas nesses casos é converter DOCX para HTML. Para alcançar isso a partir de aplicações .NET, este artigo explica como converter arquivos DOCX para HTML usando C#. Além disso, você aprenderá como controlar dinamicamente a conversão de DOCX para HTML usando diferentes opções.
- API C# para Conversão de DOCX para HTML
- Converter um DOCX para HTML em C#
- Personalizar a Conversão de DOCX para HTML
API C# DOCX para HTML – Download Gratuito
Para realizar a conversão de DOCX para HTML dentro de aplicações .NET, usamos Aspose.Words for .NET. É uma poderosa biblioteca de classes que permite criar e manipular documentos Word. Além disso, você pode converter documentos DOCX para vários outros formatos de arquivo. Você pode baixar a API ou instalá-la via NuGet.
PM> Install-Package Aspose.Words
Converter DOCX para HTML em C#
Aspose.Words for .NET torna bastante simples converter um documento DOCX para HTML. Basta carregar o documento DOCX e salvá-lo como um arquivo HTML. Abaixo estão os passos para converter um arquivo DOCX para HTML em C#.
- Carregue o documento DOCX usando a classe Document.
- Converta o documento DOCX para HTML usando o método Document.Save(string, SaveFormat).
O seguinte exemplo de código demonstra como converter um DOCX para HTML usando C#.
// Carregar o documento do disco
Document doc = new Document("Document.docx");
// Salvar o documento como HTML
doc.Save("Document.html", SaveFormat.Html);
Personalizar a Conversão de DOCX para HTML em C#
Aspose.Words for .NET também permite personalizar a conversão de DOCX para HTML com várias opções. Por exemplo, você pode especificar uma pasta para armazenar arquivos de recursos (CSS, fontes e imagens) separadamente. Além disso, você pode exportar informações de round-trip do documento. As seções a seguir mostram como usar essas opções.
C# DOCX para HTML – Exportar Informações de Roundtrip
O MS Word fornece uma variedade de recursos, nem todos suportados pelo HTML. Para manter o conteúdo HTML próximo ao documento original, as informações de round-trip são usadas. Os seguintes passos demonstram como exportar informações de round-trip durante a conversão de DOCX para HTML em C#.
- Carregue o documento DOCX usando a classe Document.
- Crie um objeto da classe HtmlSaveOptions.
- Ative a exportação de informações de round-trip usando a propriedade HtmlSaveOptions.ExportRoundtripInformation.
- Converta o documento DOCX para HTML usando o método Document.Save(string, HtmlSaveOptions).
O seguinte exemplo de código mostra como exportar informações de round-trip durante a conversão de DOCX para HTML em C# .NET.
// Carregar o documento do disco
Document doc = new Document("Document.docx");
// Ativar informações de round-trip
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;
// Salvar como HTML
doc.Save("ExportRoundtripInformation_out.html", options);
Conversão de C# DOCX para HTML – Especificar a Pasta de Recursos
Durante a conversão de DOCX para HTML, você pode salvar arquivos de recursos em uma pasta separada. Além disso, você pode especificar pastas para armazenar fontes e imagens separadamente. Abaixo estão os passos para alcançar isso.
- Carregue o documento DOCX usando a classe Document.
- Crie um objeto da classe HtmlSaveOptions.
- Defina a pasta de recursos usando a propriedade HtmlSaveOptions.ResourceFolder.
- Converta o documento DOCX para HTML usando o método Document.Save(string, HtmlSaveOptions).
O seguinte exemplo de código mostra como armazenar recursos em uma pasta separada durante a conversão de C# DOCX para HTML.
// Carregar o documento
Document doc = new Document("document.docx");
// Especificar a pasta para recursos
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";
// Converter o documento para HTML
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);
Saiba mais sobre como trabalhar com pastas de recursos durante a conversão de DOCX para HTML.
API C# para Conversão de DOCX para HTML – Obter uma Licença Gratuita
Você pode obter uma licença temporária para usar Aspose.Words for .NET sem limitações de avaliação.
Conclusão
Neste artigo, você aprendeu como converter arquivos DOCX para HTML usando C#. Além disso, você viu como usar várias opções para personalizar a conversão de DOCX para HTML. Você também pode explorar outros recursos do Aspose.Words for .NET usando a documentação. Além disso, você pode postar suas perguntas em nosso fórum.