Jsoup es una librería de Java de código abierto utilizada principalmente para la extracción de datos HTML. También permite modificar y generar HTML. Tiene una ruta de desarrollo consistente, excelente documentación y una API fácil de usar. Con Jsoup también se puede construir y analizar XML. Utilizando selectores CSS o expresiones XPath, las capacidades de Jsoup pueden emplearse para analizar y manipular datos HTML. Esto incluye cargar archivos HTML desde archivos, URLs o cadenas, buscar elementos, manipular atributos, texto y elementos HTML, y cargar documentos HTML desde cadenas. Se utiliza frecuentemente para tareas de web scraping, análisis de datos y minería de datos, permitiendo a los desarrolladores de Java recopilar información relevante de páginas HTML y analizarla de manera programática.