HTML é uma linguagem de marcação para criar ou projetar documentos a serem exibidos em navegadores. Pode incluir texto ou informações visuais na página. Em alguns casos, você pode querer extrair texto de documentos HTML. De acordo com esses casos de uso, este artigo aborda como extrair texto de HTML programaticamente em Java.