Преобразование HTML в Word DOCX

Файлы HTML часто используются для создания, редактирования или передачи большого количества информации. Точно так же файлы Microsoft Word, включая DOCX и DOC, также известны благодаря различным функциям. Вы можете преобразовывать файлы веб-страниц HTML в файлы Word, DOCX или DOC с высокой точностью. В этой статье вы узнаете, как конвертировать HTML в Word DOCX/DOC на C#. Давайте кратко рассмотрим следующие варианты использования:

Конвертер C# HTML в Word DOCX/DOC — Установка

Aspose.HTML для .NET API поддерживает множество функций создания, обработки и преобразования HTML. Важной особенностью является преобразование HTML в DOCX/DOC. Вы можете легко настроить API, загрузив его из раздела Новые версии или установив его из NuGet с помощью следующей команды:

PM> Install-Package Aspose.Html

Преобразование веб-страницы HTML в Word DOCX/DOC с помощью C#

Давайте рассмотрим преобразование HTML в Word DOCX/DOC на простом примере использования. Мы создадим базовый файл HTML, а затем выполним преобразование. Вам необходимо выполнить следующие шаги для преобразования HTML в файл Word (DOCX/DOC) в C#:

  1. Напишите простой HTML-файл
  2. Загрузить исходный HTML-файл
  3. Инициализировать объект DocSaveOptions
  4. Преобразование веб-страницы HTML в Word DOCX

В приведенном ниже коде показано, как преобразовать веб-страницу HTML в файл Word, такой как DOCX/DOC:

// Подготовьте HTML-код и сохраните его в файл.
var code = @"<span>Hello World!!</span>";
System.IO.File.WriteAllText("document.html", code);

// Инициализировать документ HTML из файла
using (var document = new HTMLDocument("document.html"))
{
    // Инициализировать DocSaveOptions 
    var options = new Aspose.Html.Saving.DocSaveOptions();

    // Преобразование веб-страницы HTML в DOCX
    Aspose.Html.Converters.Converter.ConvertHTML(document, options, "output.docx");
}

Преобразование HTML в Word с помощью дополнительных параметров в C#

Давайте сделаем еще один шаг вперед. Вы можете изменить размер страницы, поля, цвет фона и другие свойства, используя объект DocSaveOptions. Все эти параметры способствуют большему контролю над преобразованием файлов. Это может помочь вам выполнить ваши требования, не заботясь о базовых форматах файлов. Вы должны выполнить следующие шаги для преобразования HTML в DOCX с дополнительными параметрами с помощью C#:

  1. Загрузить исходный HTML-файл
  2. Инициализировать объект DocSaveOptions
  3. Укажите размер страницы в дюймах
  4. Вызов метода ConvertHTML для преобразования HTML в Word DOCX

Приведенный ниже код основан на описанных выше шагах, которые показывают, как преобразовать HTML в файл Word DOCX на C#:

// Подготовьте HTML-код и сохраните его в файл
var code = @"<span>Hello World!!</span>";
System.IO.File.WriteAllText("document.html", code);

// Установите A5 в качестве размера страницы
var options = new Aspose.Html.Saving.DocSaveOptions
{
    PageSetup =
    {
        AnyPage = new Aspose.Html.Drawing.Page()
        {
            Size = new Aspose.Html.Drawing.Size(Aspose.Html.Drawing.Length.FromInches(8.3f), Aspose.Html.Drawing.Length.FromInches(5.8f))
        }
    }
};

// Преобразование HTML-документа в DOCX
Aspose.Html.Converters.Converter.ConvertHTML("document.html", options, "output.docx");

Вывод

В этой статье мы рассмотрели преобразование HTML в Word (DOCX/DOC) программным путем с помощью C#. Кроме того, вы можете посетить Раздел документации или Справочник по API для дальнейшего анализа. В случае каких-либо неясностей или сомнений напишите нам на Форум бесплатной поддержки.

Смотрите также