Skip to main content
Piloterr

Qu'est-ce que Jsoup ?

Jsoup

Jsoup est une bibliothèque Java open source principalement utilisée pour l'extraction de données HTML. Vous pouvez également modifier et produire du HTML avec elle. Elle dispose d'un parcours de développement cohérent, d'une excellente documentation et d'une API facile à utiliser. Jsoup peut également construire et analyser du XML. Les capacités de Jsoup peuvent être utilisées pour analyser et manipuler des données HTML à l'aide de sélecteurs CSS ou d'expressions XPath. Cela inclut le chargement de fichiers HTML depuis des fichiers, des URL ou des chaînes, la recherche d'éléments, la manipulation de propriétés, de textes et d'éléments HTML, et le chargement de documents HTML depuis des chaînes. Elle est fréquemment utilisée pour le scraping web, l'analyse de données et le data mining, permettant aux développeurs Java de collecter des informations pertinentes à partir de pages HTML et de les analyser de manière programmatique.

Termes associés