WordからHTMLへのJava

Word文書のコンテンツをアプリケーションに埋め込むには、変換を実行する必要がある場合があります。このような場合に最も広く選択されている変換は、WordからHTMLまたはWordから画像です。これに従って、この記事では、Javaを使用してWordDOCXまたはDOCファイルをHTMLに変換する方法について説明します。また、リソースファイルを別のフォルダーに保持する方法についても説明します。

WordからHTMLへの変換のためのJavaAPI

DOCX / DOCからHTMLへの変換には、Aspose.Words for Javaを使用します。これは、Javaアプリケーション内からワードプロセッシング機能を実装するための強力なAPIです。さらに、APIは、Word文書からHTMLおよびその他の形式への忠実な変換を提供します。 APIをダウンロードするか、Mavenからインストールできます。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.10</version>
    <type>pom</type>
</dependency>

JavaでWord文書をHTMLに変換する

Word文書をHTMLに変換するには、文書をロードしてHTMLファイルとして保存するだけです。以下は、Javaを使用してWordDOCXファイルをHTMLに変換する手順です。

次のコードサンプルは、Javaを使用してWord文書をHTMLに変換する方法を示しています。

// ディスクからドキュメントをロードする
Document doc = new Document("document.docx");

// ドキュメントをHTMLとして保存
doc.save("Document_out.html", SaveFormat.HTML);

WordからHTMLへの変換でリソースフォルダを指定する

リソースファイルを別のフォルダーに保存するようにAPIを構成することもできます。さらに、フォントと画像を別々のフォルダに保存できます。リソースフォルダを指定する手順は次のとおりです。

次のコードサンプルは、WordからHTMLへの変換でリソースファイルを別のフォルダーに保持します。

// ドキュメントを読み込む
Document doc = new Document("Document.docx");

// リソースフォルダを指定する
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");

// Word文書をHTMLに変換する
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);

WordからHTMLへの変換でのリソースフォルダの操作については、続きを読むできます。

無料のAPIライセンスを取得する

無料の一時ライセンスを取得することで、評価の制限なしにAspose.WordsforJavaを使用できます。

結論

この記事では、Javaを使用してプログラムでWordDOCXまたはDOCファイルをHTMLに変換する方法を学習しました。これに加えて、WordからHTMLへの変換でリソースファイルを個別に保存する方法を見てきました。さらに、ドキュメントを使用して、Aspose.WordsforJavaの詳細を読むことができます。さらに、あなたは私たちのフォーラムであなたの質問を私たちと共有することができます。

関連項目