Слово в HTML С#

В различных случаях вам необходимо отобразить содержимое документов Word в веб-приложениях или приложениях для настольных компьютеров. Одним из подходящих вариантов в таких случаях является конвертация документов Word в HTML. Чтобы добиться этого из приложений .NET, в этой статье рассказывается, как преобразовать файлы Word DOCX или DOC в HTML с помощью C#. Кроме того, вы узнаете, как динамически управлять преобразованием Word в HTML, используя различные параметры.

C# API для преобразования Word в HTML

Чтобы выполнить преобразование Word в HTML из приложений .NET, мы будем использовать Aspose.Words for .NET. Это мощная библиотека классов, позволяющая создавать документы Word и управлять ими. Кроме того, он позволяет конвертировать документы Word в различные другие форматы файлов. Вы можете либо скачать API, либо установить его с помощью NuGet.

PM> Install-Package Aspose.Words 

Преобразование документа Word в HTML на C#

Aspose.Words для .NET значительно упрощает преобразование документа Word в HTML. Просто загрузите документ Word и сохраните его как файл HTML. Ниже приведены шаги для преобразования файла Word DOCX в HTML на C#.

В следующем примере кода показано, как преобразовать документ Word в HTML с помощью C#.

// Загрузите документ с диска
Document doc = new Document("Document.docx");

// Сохраните документ как HTML
doc.Save("Document.html", SaveFormat.Html);

Настройка преобразования Word в HTML в C#

Aspose.Words для .NET также позволяет настраивать преобразование Word в HTML, используя различные параметры. Например, вы можете указать папку для хранения файлов ресурсов (CSS, шрифтов и изображений) отдельно. Кроме того, вы можете экспортировать двустороннюю информацию о документе. В следующих разделах показано, как использовать эти параметры.

Экспорт информации о передаче данных в формате Word в HTML Преобразование

MS Word предоставляет широкий спектр функций, и не все из них поддерживаются HTML. Поэтому, чтобы сделать содержимое HTML близким к исходному документу, используется двусторонняя информация. Следующие шаги показывают, как экспортировать двустороннюю информацию при преобразовании Word в HTML.

В следующем образце кода показано, как экспортировать информацию о цикле приема-передачи при преобразовании Word в HTML.

// Загрузите документ с диска
Document doc = new Document("Document.docx");

// Включить информацию о круговых поездках
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;

// Сохранить как HTML
doc.Save("ExportRoundtripInformation_out.html", options);

Укажите папку ресурсов в преобразовании Word в HTML

Выполняя преобразование Word в HTML, вы можете сохранить файлы ресурсов в отдельной папке. Кроме того, вы можете указать папки для хранения шрифтов и изображений отдельно. Ниже приведены шаги для достижения этого.

В следующем примере кода показано, как хранить ресурсы в отдельной папке при преобразовании Word в HTML.

// Загрузить документ 
Document doc = new Document("document.docx");

// Установить папку для ресурсов
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";

// Преобразование документа в HTML
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);

Подробнее о работе с папками ресурсов при преобразовании Word в HTML.

Получите бесплатную лицензию API

Вы можете получить временную лицензию, чтобы использовать Aspose.Words для .NET без ограничений на пробную версию.

Вывод

В этой статье вы узнали, как преобразовать документы Word DOCX или DOC в HTML с помощью C#. Кроме того, вы увидели, как использовать различные параметры для настройки преобразования Word в HTML. Вы также можете изучить другие функции Aspose.Words для .NET, используя документацию. Кроме того, вы можете размещать свои вопросы на нашем форуме.

Смотрите также