HTML är ett märkningsspråk för att skapa eller designa dokument som ska visas i webbläsare. Det kan innehålla text eller visuell information på sidan. I vissa fall kanske du vill extrahera text från HTML-dokument. I enlighet med sådana användningsfall täcker den här artikeln hur man extraherar text från HTML programmatiskt i Java.