Unter Data Cleaning versteht man das Korrigieren oder Entfernen von unvollständigen, duplizierten, ungenauen, beschädigten, schlecht strukturierten oder fehlerhaften Daten aus einem Datensatz. Beim Zusammenführen mehrerer Datenquellen gibt es zahlreiche Möglichkeiten, wie Daten dupliziert oder falsch gekennzeichnet werden können.
Was ist Data Cleaning?