
さまざまな場合に、WebまたはデスクトップアプリケーションでWord文書のコンテンツを表示する必要があります。このような場合の適切なオプションの1つは、Word文書をHTMLに変換することです。 .NETアプリケーション内からこれを実現するために、この記事では、C#を使用してWordDOCXまたはDOCファイルをHTMLに変換する方法について説明します。さらに、さまざまなオプションを使用してWordからHTMLへの変換を動的に制御する方法を学習します。
WordからHTMLへの変換のためのC#API
.NETアプリケーション内からWordからHTMLへの変換を実行するには、Aspose.Words for .NETを使用します。これは、Word文書を作成および操作できる強力なクラスライブラリです。また、Word文書を他のさまざまなファイル形式に変換することもできます。 APIをダウンロードするか、NuGetを使用してインストールできます。
PM> Install-Package Aspose.Words
C#でWord文書をHTMLに変換する
Aspose.Words for .NETを使用すると、Word文書をHTMLに変換するのが非常に簡単になります。 Word文書をロードし、HTMLファイルとして保存するだけです。以下は、C#でWordDOCXファイルをHTMLに変換する手順です。
- Documentクラスを使用してWordドキュメントをロードします。
- Document.Save(string, SaveFormat)メソッドを使用してWord文書をHTMLに変換します。
次のコードサンプルは、C#を使用してWord文書をHTMLに変換する方法を示しています。
// ディスクからドキュメントをロードする
Document doc = new Document("Document.docx");
// ドキュメントをHTMLとして保存
doc.Save("Document.html", SaveFormat.Html);
C#でWordからHTMLへの変換をカスタマイズする
Aspose.Words for .NETでは、さまざまなオプションを使用してWordからHTMLへの変換をカスタマイズすることもできます。たとえば、リソースファイル(CSS、フォント、および画像)を個別に保持するフォルダーを指定できます。さらに、ドキュメントの往復情報をエクスポートできます。次のセクションでは、これらのオプションの使用方法を示します。
WordからHTMLへの変換での往復情報のエクスポート
MS Wordは幅広い機能を提供しますが、これらすべてがHTMLでサポートされているわけではありません。したがって、HTMLのコンテンツを元のドキュメントに近づけるために、ラウンドトリップ情報が使用されます。次の手順は、WordからHTMLへの変換でラウンドトリップ情報をエクスポートする方法を示しています。
- Documentクラスを使用してWordドキュメントをロードします。
- HtmlSaveOptionsクラスのオブジェクトを作成します。
- HtmlSaveOptions.ExportRoundtripInformationプロパティを使用して、ラウンドトリップ情報のエクスポートを有効にします。
- Document.Save(string, HtmlSaveOptions)メソッドを使用して、Word文書をHTMLに変換します。
次のコードサンプルは、WordからHTMLへの変換でラウンドトリップ情報をエクスポートする方法を示しています。
// ディスクからドキュメントをロードする
Document doc = new Document("Document.docx");
// 往復情報を有効にする
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;
// HTMLとして保存
doc.Save("ExportRoundtripInformation_out.html", options);
WordからHTMLへの変換でリソースフォルダを指定する
WordからHTMLへの変換を実行しているときに、リソースファイルを別のフォルダーに保存できます。また、フォントと画像を別々に保持するフォルダを指定することもできます。これを実現するための手順は次のとおりです。
- Documentクラスを使用してWordドキュメントをロードします。
- HtmlSaveOptionsクラスのオブジェクトを作成します。
- HtmlSaveOptions.ResourceFolderプロパティを使用してリソースフォルダを設定します。
- Document.Save(string, HtmlSaveOptions)メソッドを使用して、Word文書をHTMLに変換します。
次のコードサンプルは、WordからHTMLへの変換でリソースを別のフォルダーに保持する方法を示しています。
// ドキュメントを読み込む
Document doc = new Document("document.docx");
// リソースのフォルダを設定する
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";
// ドキュメントをHTMLに変換する
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);
続きを読むWordからHTMLへの変換でのリソースフォルダの操作について。
無料のAPIライセンスを取得する
評価の制限なしにAspose.Words for .NETを使用するために、一時ライセンスを取得することができます。
結論
この記事では、C#を使用してWordDOCXまたはDOCドキュメントをHTMLに変換する方法を学習しました。さらに、さまざまなオプションを使用してWordからHTMLへの変換をカスタマイズする方法を見てきました。 ドキュメントを使用して、Aspose.Words for .NETの他の機能を調べることもできます。さらに、あなたは私たちのフォーラムにあなたの質問を投稿することができます。