Слово в HTML С#

В различных случаях вам необходимо отобразить содержимое файлов Word DOCX в веб-приложениях или приложениях для настольных ПК. Одним из подходящих вариантов в таких случаях является преобразование DOCX в HTML. Чтобы добиться этого из приложений .NET, в этой статье рассказывается, как преобразовать файлы DOCX в HTML на C#. Кроме того, вы узнаете, как динамически управлять преобразованием DOCX в HTML, используя различные параметры.

C# DOCX to HTML Converter API — скачать бесплатно

Чтобы выполнить преобразование DOCX в HTML из приложений .NET, мы будем использовать Aspose.Words for .NET. Это мощная библиотека классов, позволяющая создавать документы Word и управлять ими. Кроме того, он позволяет конвертировать документы DOCX в различные другие форматы файлов. Вы можете либо скачать API, либо установить его с помощью NuGet.

PM> Install-Package Aspose.Words 

Преобразование DOCX в HTML на C#

Aspose.Words for .NET значительно упрощает преобразование документа DOCX в HTML. Просто загрузите документ DOCX и сохраните его как файл HTML. Ниже приведены шаги для преобразования файла DOCX в HTML на C#.

В следующем примере кода показано, как преобразовать DOCX в HTML с помощью C#.

// Загрузите документ с диска
Document doc = new Document("Document.docx");

// Сохраните документ как HTML
doc.Save("Document.html", SaveFormat.Html);

C# Настройка преобразования DOCX в HTML

Aspose.Words for .NET также позволяет настраивать преобразование DOCX в HTML, используя различные параметры. Например, вы можете указать папку для хранения файлов ресурсов (CSS, шрифтов и изображений) отдельно. Кроме того, вы можете экспортировать двустороннюю информацию о документе. В следующих разделах показано, как использовать эти параметры.

C# DOCX в HTML — экспорт информации о двустороннем обходе

MS Word предоставляет широкий спектр функций, и не все из них поддерживаются HTML. Поэтому, чтобы сделать содержимое HTML близким к исходному документу, используется двусторонняя информация. Следующие шаги показывают, как экспортировать двустороннюю информацию из DOCX в преобразование HTML в C#.

В следующем образце кода показано, как экспортировать информацию о циклическом обмене в формате DOCX для преобразования HTML в C# .NET.

// Загрузите документ с диска
Document doc = new Document("Document.docx");

// Включить информацию о круговых поездках
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;

// Сохранить как HTML
doc.Save("ExportRoundtripInformation_out.html", options);

Преобразование C# DOCX в HTML — укажите папку ресурсов

При выполнении преобразования DOCX в HTML вы можете сохранить файлы ресурсов в отдельной папке. Кроме того, вы можете указать папки для хранения шрифтов и изображений отдельно. Ниже приведены шаги для достижения этого.

В следующем примере кода показано, как хранить ресурсы в отдельной папке при преобразовании C# DOCX в HTML.

// Загрузить документ 
Document doc = new Document("document.docx");

// Установить папку для ресурсов
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";

// Преобразование документа в HTML
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);

Подробнее о работе с папками ресурсов при преобразовании DOCX в HTML.

C# API для преобразования DOCX в HTML — получите бесплатную лицензию

Вы можете получить временную лицензию, чтобы использовать Aspose.Words for .NET без ограничений на пробную версию.

Вывод

В этой статье вы узнали, как конвертировать файлы DOCX в HTML на C#. Кроме того, вы увидели, как использовать различные параметры для настройки преобразования DOCX в HTML. Вы также можете изучить другие функции Aspose.Words for .NET, используя документацию. Кроме того, вы можете размещать свои вопросы на нашем форуме.

Смотрите также