Převést Word DOC DOCX na HTML MHTML

Pokud potřebujete do webových stránek vložit dokument Word, pak je převod Word DOC do HTML jednou z nejlepších vhodných možností. V tomto článku se dozvíte, jak nejjednodušeji převést dokument Wordu do HTML v C#. Pojďme se tedy podívat na to, jak provést vysokorychlostní a vysoce kvalitní převod Wordu do HTML v několika krocích. Pro převod dokumentů DOC a DOCX můžete použít poskytnuté ukázky kódu.

Jak převést Word DOC do HTML v C#

Chcete-li převést dokument aplikace Word do formátu HTML, nejprve nainstalujeme Aspose.Words for .NET. Je to jedna z nejlepších knihoven pro převod dokumentů Word, která poskytuje bezplatnou konverzi Wordu do HTML. Můžete si jej stáhnout ze sekce New Releases nebo instalací z NuGet pomocí příkazu níže:

PM> Install-Package Aspose.Words

Převést dokument aplikace Word na HTML v C#

Níže jsou uvedeny kroky pro převod dokumentu aplikace Word na HTML v C#. Dokument může být soubor DOC nebo DOCX.

  1. Načtěte dokument aplikace Word pomocí třídy Document.
  2. Inicializujte instanci HtmlSaveOptions a nastavte formát uložení.
  3. Uložte dokument aplikace Word jako HTML pomocí metody Document.Save().

Následující fragment kódu ukazuje, jak převést dokument aplikace Word na HTML v C#.

// Načtěte dokument z disku.
Document doc = new Document(dataDir + "Test File.docx");

// Nastavte možnosti HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// Uložte dokument do HTML
doc.Save(dataDir + "Document.html", options);

Uložit DOCX do HTML – informace o zpáteční cestě

Zpáteční informace jsou užitečné pro scénáře, kdy je převedený soubor HTML opět vykreslen jako dokument aplikace Word. V takových případech můžete povolit dynamický export těchto informací. Níže jsou uvedeny kroky k exportu zpátečních informací v převodu Word do HTML.

  1. Načtěte dokument aplikace Word pomocí třídy Document.
  2. Inicializujte instanci HtmlSaveOptions
  3. Nastavte HtmlSaveOptions.ExportRoundtripInformation na hodnotu true
  4. Převeďte dokument aplikace Word jako HTML pomocí metody Document.Save().

Níže uvedený úryvek kódu vysvětluje, jak exportovat zpáteční informace v převodu DOC aplikace Word na HTML v C#.

// Načtěte dokument z disku.
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// Vlastnost HtmlSaveOptions.ExportRoundtripInformation určuje
// Zda zapsat zpáteční informace při ukládání do HTML, MHTML nebo EPUB.
// Výchozí hodnota je true pro HTML a false pro MHTML a EPUB.
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

Export Word DOC do MHTML v C#

Formát MHTML stojí za zmínku, když potřebujete jeden HTML soubor s vloženými obrázky a fonty. Pokud tedy potřebujete převést dokumenty Wordu do formátu MHTML, nemusíte se bát. Můžete to udělat podle následujících kroků.

  1. Načtěte dokument aplikace Word pomocí třídy Document.
  2. Inicializujte instanci HtmlSaveOptions and set SaveFormat to MHTML.
  3. Exportujte dokument aplikace Word jako MHTML pomocí metody Document.Save().

Níže uvedený fragment kódu ukazuje, jak převést Word DOCX na MHTML v C#.

// Načtěte dokument z disku.
Document doc = new Document(dataDir + "Test File.docx");

// Nastavte možnosti HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// Uložte dokument do MHTML
doc.Save(dataDir + "Document.mhtml", options);

Zdarma Word to HTML Converter

Získejte zcela bezplatnou dočasnou licenci pro převod dokumentů Wordu do HTML bez jakýchkoliv omezení hodnocení.

C# Word Converter – Přečtěte si více

Můžete se podívat na odkazy na API a dokumentaci Aspose.Words for .NET. Kromě toho nám můžete napsat zpět a zeptat se na cokoli na Free Support Forum.

Závěr

V tomto článku jsme se zabývali tím, jak převést dokumenty aplikace Word na soubory HTML nebo MHTML v C#. Můžete to udělat bez instalace aplikace Microsoft Word. Kromě toho můžete použít stejný kód C# k převodu DOC do HTML nebo DOCX do HTML z vašich aplikací .NET.

Viz také