WordDOCDOCXをHTMLMHTMLに変換する

この記事では、C#またはVB.NETを使用してWord文書DOCDOCXHTMLまたはMHTMLに変換する方法について説明します。 Aspose.Words for .NET APIを使用すると、この変換を非常に簡単に実行できます。 Microsoft Wordドキュメントの変換は一般的な使用例であるため、APIではさまざまなオプションがサポートされています。この記事で取り上げられている見出しを見ることができます。

C#WordtoHTMLまたはMHTMLConverterAPI

Aspose.Words for .NET APIは、MicrosoftWordでサポートされているファイル形式で動作するように特別に設計されています。 New ReleasesセクションからAPIをダウンロードするか、次のコマンドを使用してNuGetからAPIをインストールすることにより、DOCXまたはDOCファイルをHTMLまたはMHTMLファイル形式に変換できます。

Install-Package Aspose.Words -Version 20.9.0

Word DOCまたはDOCXをC#でHTMLに変換する

C#またはVB.NETを使用して、.NETアプリケーションでプログラムによってWord文書(DOC / DOCX)をHTMLWebページに効率的に変換できます。変換するには、以下の手順に従う必要があります。

  1. 入力DOCXワードドキュメントをロードします
  2. HtmlSaveOptionsのインスタンスを初期化します
  3. 出力HTMLファイルを保存します

次のコードスニペットは、これらの手順に従い、C#またはVB.NETを使用してDOC/DOCXをHTMLに変換する方法を示しています。

// ディスクからドキュメントをロードします。
Document doc = new Document(dataDir + "Test File.docx");

// HtmlSaveOptionsを設定します
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Html;

// ドキュメントをHTMLに保存します
doc.Save(dataDir + "Document.html", options);

Word DOCまたはDOCXをC#のラウンドトリップ情報を使用してHTMLに変換します

WordからHTMLへの変換中にいくつかの追加情報が保存されます。これはラウンドトリップ情報として知られており、変換されたHTMLファイルが再びWord文書としてレンダリングされるシナリオに役立ちます。次の手順に従って、C#を使用してDOC/DOCXをHTMLに変換できます。

  1. 入力ワードドキュメントをロードします
  2. ExportRoundtripInformationをtrueに設定します
  3. 出力HTMLファイルを保存します

以下のコードスニペットは、C#またはVB.NETを使用してWord DOC/DOCXファイルをラウンドトリップ情報を含むHTMLに変換する方法を説明しています。

// ディスクからドキュメントをロードします。
Document doc = new Document(dataDir + "Test File (doc).docx");

HtmlSaveOptions options = new HtmlSaveOptions();

// HtmlSaveOptions.ExportRoundtripInformationプロパティは指定します
// HTML、MHTML、またはEPUBに保存するときにラウンドトリップ情報を書き込むかどうか。
// デフォルト値は、HTMLの場合はtrue、MHTMLとEPUBの場合はfalseです。
options.ExportRoundtripInformation = true;
            
doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);

Word DOCまたはDOCXをC#でMHTMLに変換する

画像とフォントが埋め込まれた単一のHTMLファイルが必要な場合は、MHTMLファイル形式について言及する価値があります。以下の手順で、Word文書(DOC / DOCX)をMHTMLに変換できます。

  1. ソースDOC/DOCXファイルをロードします
  2. SaveFormatをMHTMLに設定します

以下のコードスニペットは、C#またはVB.NETを使用してWord文書(DOC / DOCX)をMHMLに変換する方法を示しています。

// ディスクからドキュメントをロードします。
Document doc = new Document(dataDir + "Test File.docx");

// HtmlSaveOptionsを設定します
HtmlSaveOptions options = new HtmlSaveOptions();
options.SaveFormat = SaveFormat.Mhtml;

// ドキュメントをMHTMLに保存します
doc.Save(dataDir + "Document.mhtml", options);

結論

この記事では、Microsoft Wordアプリケーションをインストールせずに、C#でWord文書をHTMLまたはMHTMLファイルに変換する方法について説明しました。さらに、Word文書を必要なファイル形式にエクスポートするためのAPI呼び出しを行うための例と詳細な手順を学びました。さらに、APIリファレンスドキュメントをご覧ください。さらに、無料サポートフォーラムで私たちに返信して質問することができます。

関連項目