Веб-очистка также называется очисткой данных, сбором веб-страниц или веб-сканированием, которое используется для извлечения данных с веб-страниц. Веб-парсер может использовать разные подходы для извлечения информации. Например, XPath, селекторы CSS, пользовательские фильтры, HTML-навигация и т. д. В соответствии с такими сценариями в этой статье рассказывается, как программно создать парсер веб-страниц на Java.