Le clustering K-means catégorise des données non étiquetées de manière non supervisée en utilisant des caractéristiques plutôt que des catégories prédéfinies. La variable K indique le nombre de groupes ou catégories produits. L'objectif est de diviser les données en K clusters distincts et de déterminer la position du centre de masse de chaque cluster. Un cluster (classe) peut ensuite être attribué à un nouveau point de données en fonction du centre de masse le plus proche. Cette méthode présente l'avantage majeur d'éliminer le biais humain de l'analyse. La machine construit ses propres clusters plutôt que de laisser un chercheur le faire sur la base de conjectures.
Qu'est-ce que le clustering K-means ?