Der Prozess der Verringerung von Variablen in einem Trainingsdatensatz, der zur Erstellung von Machine-Learning-Modellen verwendet wird, wird als "Dimensionalitätsreduktion" bezeichnet. Durch die Transformation hochdimensionaler Daten in einen niedrigerdimensionalen Raum, der das "Kernwesen" der Daten erfasst, steuert das Verfahren die Dimensionalität der Daten. Es wird häufig in Bereichen wie Spracherkennung, Signalverarbeitung, Bioinformatik usw. eingesetzt, die mit hochdimensionalen Daten arbeiten. Darüber hinaus kann es für Clusteranalyse, Rauschunterdrückung und Datenvisualisierung verwendet werden. Für die Analyse von Daten mit Millionen von Merkmalen durch Machine Learning sind zahlreiche Quellen und Berechnungen erforderlich. Zudem ist viel manuelle Arbeit involviert. Durch die Transformation eines hochdimensionalen Datensatzes in einen niedrigerdimensionalen Datensatz, ohne die wichtigen Eigenschaften des ursprünglichen Datensatzes zu verändern, vereinfacht die Dimensionalitätsreduktion diese komplexe Aufgabe vergleichsweise.
Was ist Dimensionalitätsreduktion?