MicrosoftWordファイル形式DOC/DOCXは、ワードプロセッサが情報を整理および説明するためのさまざまな機能をサポートしているため、有名です。同様に、HTMLファイル形式はWebアプリケーションで情報を表示するのに役立ちます。この記事では、Javaを使用したWordファイル(DOC / DOCX)からHTMLまたはHTML5への変換について学習します。ここで検討するユースケースは次のとおりです。
Javaを使用してWord(DOC / DOCX)をHTMLに変換する Javaを使用してDOCXをHTML5に変換する Javaを使用してパスワードで保護されたWordファイルをHTMLに変換する Javaを使用してWordをMHTMLに変換する JavaDOCXからHTMLまたはHTML5へのコンバーター-インストール まず最初に、アプリケーションでAspose.Words for JavaAPIを簡単に構成できます。 JARファイルは、すべてのAPIがほぼ毎月更新される新しいリリースセクションからダウンロードできます。さらに、Asposeが提供するすべてのJava APIは、Mavenリポジトリーを介してホストされます。同様に、Aspose.Words for Javaの依存関係は、Mavenプロジェクトで次の構成で定義できます。
リポジトリ:
AsposeJavaAPI Aspose Java API https://repository.aspose.com/repo/ 依存:
com.aspose aspose-words 20.6 jdk17 com.aspose aspose-words 20.6 javadoc これで、JavaアプリケーションでのDOCXからHTMLへの変換の準備が整いました。
Javaを使用してWord(DOC / DOCX)をHTMLに変換する 以下の手順に従って、WordをHTMLに変換できます。
DOCまたはDOCX拡張子を持つソースWordファイルをロードします ファイルを出力HTMLとして保存します 以下のコードサンプルは、Javaを使用してDOCXをHTMLに変換する方法を示しています。
// ディスクからドキュメントをロードします。 Document doc = new Document(dataDir + "TestFile.docx"); // ドキュメントをHTMLに保存します。 doc.save(dataDir + "Document_out.html", SaveFormat.HTML); 入力DOCXファイルプレビュー
HTMLファイルのプレビューを出力
したがって、これらのスクリーンショットを使用すると、ドキュメントレンダリングの忠実度が高いことに気付くことができます。 APIは、テキスト、画像、表などを変換できます。
Javaを使用してDOCXをHTML5に変換する HTML5はHTMLの最新バージョンです。 Aspose.