Перетворення Word DOC DOCX на HTML MHTML

Якщо вам потрібно вставити документ Word у веб-сторінки, перетворення Word DOC у HTML є одним із найкращих варіантів. У цій статті ви дізнаєтесь, як найпростіше перетворити документ Word на HTML у C#. Тож давайте розглянемо, як виконати швидкісне та якісне перетворення Word у HTML за кілька кроків. Ви можете використовувати надані зразки коду для конвертації документів DOC і DOCX.

Як перетворити Word DOC на HTML на C#

Щоб конвертувати документ Word у формат HTML, ми спочатку встановимо Aspose.Words for .NET. Це одна з найкращих бібліотек для перетворення документів Word, яка забезпечує безкоштовне перетворення Word у HTML. Ви можете завантажити його з розділу Нові випуски або інсталювати з NuGet за допомогою команди нижче:

PM> Install-Package Aspose.Words

Перетворення документа Word на HTML у C#

Нижче наведено кроки для перетворення документа Word на HTML у C#. Документ може бути файлом DOC або DOCX.

  1. Завантажте документ Word за допомогою класу Document.
  2. Ініціалізуйте екземпляр HtmlSaveOptions і встановіть формат збереження.
  3. Збережіть документ Word як HTML за допомогою методу Document.Save().

У наведеному нижче фрагменті коду показано, як перетворити документ Word на HTML у C#.

// Завантажте документ з диска.
Document doc = new Document(dataDir + "Test File.docx");

// Встановіть HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// Збережіть документ у HTML
doc.Save(dataDir + "Document.html", options);

Збережіть DOCX у HTML – інформація про подорож туди й назад

Інформація про зворотний шлях корисна для сценаріїв, коли перетворений файл HTML знову відображається як документ Word. Для таких випадків можна ввімкнути динамічний експорт цієї інформації. Нижче наведено кроки для експорту зворотної інформації в Word для перетворення HTML.

  1. Завантажте документ Word за допомогою класу Document.
  2. Ініціалізація екземпляра HtmlSaveOptions
  3. Установіть для HtmlSaveOptions.ExportRoundtripInformation значення true
  4. Перетворіть документ Word як HTML за допомогою методу Document.Save().

У наведеному нижче фрагменті коду пояснюється, як експортувати інформацію про двосторонню передачу в Word DOC для перетворення HTML у C#.

// Завантажте документ з диска.
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// Властивість HtmlSaveOptions.ExportRoundtripInformation визначає
// Чи записувати інформацію про зворотний шлях під час збереження в HTML, MHTML або EPUB.
// Значення за замовчуванням — true для HTML і false для MHTML і EPUB.
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

Експорт Word DOC до MHTML у C#

Формат MHTML варто згадати, коли вам потрібен один файл HTML із вбудованими зображеннями та шрифтами. Отже, якщо вам потрібно конвертувати документи Word у формат MHTML, не потрібно хвилюватися. Ви можете зробити це, виконавши наведені нижче дії.

  1. Завантажте документ Word за допомогою класу Document.
  2. Ініціалізація екземпляра HtmlSaveOptions and set SaveFormat to MHTML.
  3. Експортуйте документ Word як MHTML за допомогою методу Document.Save().

Наведений нижче фрагмент коду показує, як перетворити Word DOCX на MHTML у C#.

// Завантажте документ з диска.
Document doc = new Document(dataDir + "Test File.docx");

// Встановіть HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// Збережіть документ у MHTML
doc.Save(dataDir + "Document.mhtml", options);

Безкоштовний конвертер Word в HTML

Отримайте абсолютно безкоштовну тимчасову ліцензію, щоб конвертувати документи Word у HTML без будь-яких оціночних обмежень.

C# Word Converter - Докладніше

Ви можете переглянути посилання на API та документацію Aspose.Words for .NET. Крім того, ви можете написати нам і запитати про будь-що на безкоштовному форумі підтримки.

Висновок

У цій статті ми розглянули, як конвертувати документи Word у файли HTML або MHTML у C#. Ви можете зробити це, не встановлюючи програму Microsoft Word. Крім того, ви можете використовувати той самий код C# для перетворення DOC у HTML або DOCX у HTML із ваших програм .NET.

Дивись також