WordからHTMLへのC#

さまざまな場合に、WebまたはデスクトップアプリケーションでWordDOCXファイルのコンテンツを表示する必要があります。このような場合の適切なオプションの1つは、DOCXからHTMLへの変換です。 .NETアプリケーション内からこれを実現するために、この記事では、C#でDOCXファイルをHTMLに変換する方法について説明します。さらに、さまざまなオプションを使用してDOCXからHTMLへの変換を動的に制御する方法を学習します。

C#DOCX to HTMLConverterAPI-無料ダウンロード

.NETアプリケーション内からDOCXからHTMLへの変換を実行するには、Aspose.Words for.NETを使用します。これは、Word文書を作成および操作できる強力なクラスライブラリです。また、DOCXドキュメントを他のさまざまなファイル形式に変換することもできます。 APIをダウンロードするか、NuGetを使用してインストールできます。

PM> Install-Package Aspose.Words 

C#でDOCXをHTMLに変換する

Aspose.Words for .NETを使用すると、DOCXドキュメントをHTMLに変換するのが非常に簡単になります。 DOCXドキュメントをロードし、HTMLファイルとして保存するだけです。以下は、C#でDOCXファイルをHTMLに変換する手順です。

次のコードサンプルは、C#を使用してDOCXをHTMLに変換する方法を示しています。

// ディスクからドキュメントをロードする
Document doc = new Document("Document.docx");

// ドキュメントをHTMLとして保存
doc.Save("Document.html", SaveFormat.Html);

C#DOCXからHTMLへの変換をカスタマイズする

Aspose.Words for .NETでは、さまざまなオプションを使用してDOCXからHTMLへの変換をカスタマイズすることもできます。たとえば、リソースファイル(CSS、フォント、および画像)を個別に保持するフォルダーを指定できます。さらに、ドキュメントの往復情報をエクスポートできます。次のセクションでは、これらのオプションの使用方法を示します。

C#DOCXからHTMLへ-往復情報のエクスポート

MS Wordは幅広い機能を提供しますが、これらすべてがHTMLでサポートされているわけではありません。したがって、HTMLのコンテンツを元のドキュメントに近づけるために、ラウンドトリップ情報が使用されます。次の手順は、DOCXのラウンドトリップ情報をC#のHTML変換にエクスポートする方法を示しています。

次のコードサンプルは、DOCXのラウンドトリップ情報をC#.NETのHTML変換にエクスポートする方法を示しています。

// ディスクからドキュメントをロードする
Document doc = new Document("Document.docx");

// 往復情報を有効にする
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;

// HTMLとして保存
doc.Save("ExportRoundtripInformation_out.html", options);

C#DOCXからHTMLへの変換-リソースフォルダーを指定します

DOCXからHTMLへの変換を実行しているときに、リソースファイルを別のフォルダーに保存できます。また、フォントと画像を別々に保持するフォルダを指定することもできます。これを実現するための手順は次のとおりです。

次のコードサンプルは、C#DOCXからHTMLへの変換でリソースを別のフォルダーに保持する方法を示しています。

// ドキュメントを読み込む 
Document doc = new Document("document.docx");

// リソースのフォルダを設定する
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";

// ドキュメントをHTMLに変換する
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);

続きを読むDOCXからHTMLへの変換でのリソースフォルダの操作について。

DOCXからHTMLへの変換用のC#API-無料ライセンスを取得

評価の制限なしにAspose.Wordsfor.NETを使用するために、一時ライセンスを取得することができます。

結論

この記事では、DOCXファイルをC#でHTMLに変換する方法を学びました。さらに、さまざまなオプションを使用してDOCXからHTMLへの変換をカスタマイズする方法を見てきました。 ドキュメントを使用して、Aspose.Wordsfor.NETの他の機能を調べることもできます。さらに、あなたは私たちのフォーラムにあなたの質問を投稿することができます。

関連項目