HTML هي لغة ترميز لإنشاء أو تصميم المستندات لعرضها في المستعرضات. يمكن أن تتضمن معلومات نصية أو مرئية في الصفحة. في بعض الحالات ، قد ترغب في استخراج نص من مستندات HTML. وفقًا لحالات الاستخدام هذه ، تتناول هذه المقالة كيفية استخراج النص من HTML برمجيًا في Java.