Java で HTML からテキストを抽出する

HTML は、ブラウザに表示されるドキュメントを作成または設計するためのマークアップ言語です。ページにテキストまたは視覚情報を含めることができます。場合によっては、HTML ドキュメントからテキストを抽出したいことがあります。このようなユース ケースに従って、この記事では Java でプログラムによって HTML からテキストを抽出する方法について説明します。
<span title='2022-08-18 01:31:00 +0000 UTC'>8月 18, 2022</span>&nbsp;·&nbsp;0 分&nbsp;·&nbsp;ファルハン・ラザ