さまざまな場合に、WebまたはデスクトップアプリケーションでWordファイルのコンテンツを表示する必要があります。このような場合の適切なオプションの1つは、WordからHTMLへの変換です。 .NETアプリケーション内からこれを実現するために、この記事では、C#でWordファイルをHTMLに変換する方法について説明します。さらに、さまざまなオプションを使用してWordからHTMLへの変換を動的に制御する方法を学習します。
C# Word to HTML Converter API - 無料ダウンロード
.NETアプリケーション内からWordからHTMLへの変換を実行するには、Aspose.Words for.NETを使用します。これは、Word文書を作成および操作できる強力なクラスライブラリです。また、Word文書を他のさまざまなファイル形式に変換することもできます。 APIをダウンロードするか、NuGetを使用してインストールできます。
PM> Install-Package Aspose.Words
C#でWordをHTMLに変換する
Aspose.Words for .NETを使用すると、Word文書をHTMLに変換するのが非常に簡単になります。 WordドキュメントをロードしてHTMLファイルとして保存するだけです。以下は、C#でWordファイルをHTMLに変換する手順です。
- Documentクラスを使用してWordドキュメントをロードします。
- Document.Save(string, SaveFormat)メソッドを使用してWord文書をHTMLに変換します。
次のコードサンプルは、C#を使用してWordをHTMLに変換する方法を示しています。
// ディスクからドキュメントをロードする
Document doc = new Document("Document.docx");
// ドキュメントをHTMLとして保存
doc.Save("Document.html", SaveFormat.Html);
C# WordからHTMLへの変換をカスタマイズ
Aspose.Words for .NETでは、さまざまなオプションを使用してWordからHTMLへの変換をカスタマイズすることもできます。たとえば、リソースファイル(CSS、フォント、および画像)を個別に保持するフォルダーを指定できます。さらに、ドキュメントの往復情報をエクスポートできます。次のセクションでは、これらのオプションの使用方法を示します。
C# WordからHTMLへ-往復情報のエクスポート
MS Wordは幅広い機能を提供しますが、これらすべてがHTMLでサポートされているわけではありません。したがって、HTMLのコンテンツを元のドキュメントに近づけるために、ラウンドトリップ情報が使用されます。次の手順は、Wordのラウンドトリップ情報をC#のHTML変換にエクスポートする方法を示しています。
- Documentクラスを使用してWordドキュメントをロードします。
- HtmlSaveOptionsクラスのオブジェクトを作成します。
- HtmlSaveOptions.ExportRoundtripInformationプロパティを使用して、ラウンドトリップ情報のエクスポートを有効にします。
- Document.Save(string, HtmlSaveOptions)メソッドを使用して、Word文書をHTMLに変換します。
次のコードサンプルは、Wordのラウンドトリップ情報をC#.NETのHTML変換にエクスポートする方法を示しています。
// ディスクからドキュメントをロードする
Document doc = new Document("Document.docx");
// 往復情報を有効にする
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;
// HTMLとして保存
doc.Save("ExportRoundtripInformation_out.html", options);
C# WordからHTMLへの変換-リソースフォルダーを指定
WordからHTMLへの変換を実行しているときに、リソースファイルを別のフォルダーに保存できます。また、フォントと画像を別々に保持するフォルダを指定することもできます。これを実現するための手順は次のとおりです。
- Documentクラスを使用してWordドキュメントをロードします。
- HtmlSaveOptionsクラスのオブジェクトを作成します。
- HtmlSaveOptions.ResourceFolderプロパティを使用してリソースフォルダを設定します。
- Document.Save(string, HtmlSaveOptions)メソッドを使用して、Word文書をHTMLに変換します。
次のコードサンプルは、C#WordからHTMLへの変換でリソースを別のフォルダーに保持する方法を示しています。
// ドキュメントを読み込む
Document doc = new Document("document.docx");
// リソースのフォルダを設定する
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";
// ドキュメントをHTMLに変換する
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);
続きを読むWordからHTMLへの変換でのリソースフォルダの操作について。
WordからHTMLへの変換のためのC# API-無料ライセンスを取得
評価の制限なしにAspose.Wordsfor.NETを使用するために、一時ライセンスを取得することができます。
結論
この記事では、C#でWordファイルをHTMLに変換する方法を学びました。さらに、さまざまなオプションを使用してWordからHTMLへの変換をカスタマイズする方法を見てきました。 ドキュメントを使用して、Aspose.Words for .NETの他の機能を調べることもできます。さらに、あなたは私たちのフォーラムにあなたの質問を投稿することができます。