Le nettoyage de données consiste à corriger ou supprimer les données incomplètes, dupliquées, inexactes, endommagées, mal structurées ou corrompues d'un jeu de données. Lors de la fusion de plusieurs sources de données, les doublons et les étiquettes incorrectes peuvent apparaître de nombreuses façons.
Qu'est-ce que le nettoyage de données ?