Konvertera Word DOC DOCX till HTML MHTML

Om du behöver bädda in ett Word-dokument på webbsidorna är Word DOC till HTML-konvertering ett av de bäst lämpade alternativen. I den här artikeln kommer du att lära dig det enklaste sättet att konvertera ett Word-dokument till HTML i C#. Så låt oss ta en titt på hur man utför höghastighets- och högkvalitativ konvertering från Word till HTML i ett par steg. Du kan använda de medföljande kodexemplen för att konvertera både DOC och DOCX dokument.

Hur man konverterar Word DOC till HTML i C#

För att konvertera ett Word-dokument till HTML-format installerar vi först Aspose.Words for .NET. Det är ett av de bästa biblioteken för konvertering av Word-dokument som tillhandahåller gratis konvertering av Word till HTML. Du kan ladda ner det från avsnittet New Releases eller genom att installera det från NuGet med kommandot nedan:

PM> Install-Package Aspose.Words

Konvertera ett Word-dokument till HTML i C#

Följande är stegen för att konvertera ett Word-dokument till HTML i C#. Dokumentet kan antingen vara en DOC- eller DOCX-fil.

  1. Ladda Word-dokumentet med dokumentklassen.
  2. Initiera en instans av HtmlSaveOptions och ställ in sparaformat.
  3. Spara Word-dokumentet som HTML med metoden Document.Save().

Följande kodsnutt visar hur man konverterar ett Word-dokument till HTML i C#.

// Ladda dokumentet från disken.
Document doc = new Document(dataDir + "Test File.docx");

// Ställ in HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// Spara dokumentet i HTML
doc.Save(dataDir + "Document.html", options);

Spara en DOCX till HTML - Information om tur och retur

Information om tur och retur är användbar för scenarier där den konverterade HTML-filen återigen renderas som ett Word-dokument. I sådana fall kan du aktivera export av denna information dynamiskt. Nedan följer stegen för att exportera information om tur och retur i Word till HTML-konvertering.

  1. Ladda Word-dokumentet med dokumentklassen.
  2. Initiera en instans av HtmlSaveOptions
  3. Ställ in HtmlSaveOptions.ExportRoundtripInformation till true
  4. Konvertera Word-dokument som HTML med metoden Document.Save().

Kodavsnittet nedan förklarar hur man exporterar information om tur och retur i Word DOC till HTML-konvertering i C#.

// Ladda dokumentet från disken.
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// HtmlSaveOptions.ExportRoundtripInformation egenskapen specificerar
// Om man ska skriva informationen tur och retur när man sparar till HTML, MHTML eller EPUB.
// Standardvärdet är sant för HTML och false för MHTML och EPUB.
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

Exportera Word DOC till MHTML i C#

MHTML-format är värt att nämna när du behöver en enda HTML-fil med inbäddade bilder och typsnitt. Så om du behöver konvertera Word-dokument till MHTML-format behöver du inte oroa dig. Du kan göra det genom att följa stegen nedan.

  1. Ladda Word-dokumentet med dokumentklassen.
  2. Initiera en instans av HtmlSaveOptions and set SaveFormat to MHTML.
  3. Exportera Word-dokument som MHTML med metoden Document.Save().

Kodavsnittet nedan visar hur man konverterar ett Word DOCX till MHTML i C#.

// Ladda dokumentet från disken.
Document doc = new Document(dataDir + "Test File.docx");

// Ställ in HtmlSaveOptions
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// Spara dokumentet i MHTML
doc.Save(dataDir + "Document.mhtml", options);

Gratis Word till HTML Converter

Skaffa en helt gratis tillfällig licens för att konvertera Word-dokument till HTML utan några utvärderingsbegränsningar.

C# Word Converter - Läs mer

Du kan ta en titt på API-referenser och Dokumentation av Aspose.Words för .NET. Dessutom kan du skriva tillbaka till oss och fråga om vad som helst på Free Support Forum.

Slutsats

I den här artikeln har vi tagit upp hur man konverterar Word-dokument till HTML- eller MHTML-filer i C#. Du kan göra det utan att installera Microsoft Word-applikationen. Dessutom kan du använda samma C#-kod för att konvertera DOC till HTML eller DOCX till HTML från dina .NET-applikationer.

Se även