В различных случаях вам необходимо отобразить содержимое файлов Word DOCX в веб-приложениях или приложениях для настольных ПК. Одним из подходящих вариантов в таких случаях является преобразование DOCX в HTML. Чтобы добиться этого из приложений .NET, в этой статье рассказывается, как преобразовать файлы DOCX в HTML на C#. Кроме того, вы узнаете, как динамически управлять преобразованием DOCX в HTML, используя различные параметры.
- C# API для преобразования DOCX в HTML
- Преобразование DOCX в HTML на C#
- Настроить преобразование DOCX в HTML
C# DOCX to HTML Converter API — скачать бесплатно
Чтобы выполнить преобразование DOCX в HTML из приложений .NET, мы будем использовать Aspose.Words for .NET. Это мощная библиотека классов, позволяющая создавать документы Word и управлять ими. Кроме того, он позволяет конвертировать документы DOCX в различные другие форматы файлов. Вы можете либо скачать API, либо установить его с помощью NuGet.
PM> Install-Package Aspose.Words
Преобразование DOCX в HTML на C#
Aspose.Words for .NET значительно упрощает преобразование документа DOCX в HTML. Просто загрузите документ DOCX и сохраните его как файл HTML. Ниже приведены шаги для преобразования файла DOCX в HTML на C#.
- Загрузите документ DOCX, используя класс Document.
- Преобразуйте документ DOCX в HTML, используя метод Document.Save(string, SaveFormat).
В следующем примере кода показано, как преобразовать DOCX в HTML с помощью C#.
// Загрузите документ с диска
Document doc = new Document("Document.docx");
// Сохраните документ как HTML
doc.Save("Document.html", SaveFormat.Html);
C# Настройка преобразования DOCX в HTML
Aspose.Words for .NET также позволяет настраивать преобразование DOCX в HTML, используя различные параметры. Например, вы можете указать папку для хранения файлов ресурсов (CSS, шрифтов и изображений) отдельно. Кроме того, вы можете экспортировать двустороннюю информацию о документе. В следующих разделах показано, как использовать эти параметры.
C# DOCX в HTML — экспорт информации о двустороннем обходе
MS Word предоставляет широкий спектр функций, и не все из них поддерживаются HTML. Поэтому, чтобы сделать содержимое HTML близким к исходному документу, используется двусторонняя информация. Следующие шаги показывают, как экспортировать двустороннюю информацию из DOCX в преобразование HTML в C#.
- Загрузите документ DOCX, используя класс Document.
- Создайте объект класса HtmlSaveOptions.
- Включите экспорт информации о пути туда и обратно, используя свойство HtmlSaveOptions.ExportRoundtripInformation.
- Преобразуйте документ DOCX в HTML, используя метод Document.Save(string, HtmlSaveOptions).
В следующем образце кода показано, как экспортировать информацию о циклическом обмене в формате DOCX для преобразования HTML в C# .NET.
// Загрузите документ с диска
Document doc = new Document("Document.docx");
// Включить информацию о круговых поездках
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;
// Сохранить как HTML
doc.Save("ExportRoundtripInformation_out.html", options);
Преобразование C# DOCX в HTML — укажите папку ресурсов
При выполнении преобразования DOCX в HTML вы можете сохранить файлы ресурсов в отдельной папке. Кроме того, вы можете указать папки для хранения шрифтов и изображений отдельно. Ниже приведены шаги для достижения этого.
- Загрузите документ DOCX, используя класс Document.
- Создайте объект класса HtmlSaveOptions.
- Задайте папку ресурсов с помощью свойства HtmlSaveOptions.ResourceFolder.
- Преобразуйте документ DOCX в HTML, используя метод Document.Save(string, HtmlSaveOptions).
В следующем примере кода показано, как хранить ресурсы в отдельной папке при преобразовании C# DOCX в HTML.
// Загрузить документ
Document doc = new Document("document.docx");
// Установить папку для ресурсов
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";
// Преобразование документа в HTML
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);
Подробнее о работе с папками ресурсов при преобразовании DOCX в HTML.
C# API для преобразования DOCX в HTML — получите бесплатную лицензию
Вы можете получить временную лицензию, чтобы использовать Aspose.Words for .NET без ограничений на пробную версию.
Вывод
В этой статье вы узнали, как конвертировать файлы DOCX в HTML на C#. Кроме того, вы увидели, как использовать различные параметры для настройки преобразования DOCX в HTML. Вы также можете изучить другие функции Aspose.Words for .NET, используя документацию. Кроме того, вы можете размещать свои вопросы на нашем форуме.