Die Hauptkomponentenanalyse (Principal Component Analysis, PCA) ist eine Technik des unüberwachten Lernens, die im maschinellen Lernen zur Dimensionsreduktion eingesetzt wird. Es handelt sich um ein statistisches Verfahren, das Beobachtungen korrelierter Merkmale durch dieselbe Transformation in einen Satz linear unkorrelierter Daten umwandelt. Diese neu transformierten Merkmale werden als Hauptkomponenten bezeichnet. PCA ist eines der häufig verwendeten Werkzeuge für explorative Datenanalysen und prädiktive Modellierung. Es ist eine Methode, um signifikante Muster in den bereitgestellten Datensätzen zu identifizieren, indem die Varianzen reduziert werden. PCA sucht häufig nach der Oberfläche mit der geringsten Dimensionalität, während hochdimensionale Daten projiziert werden. PCA berücksichtigt die Varianz jedes Merkmals, da ein hohes Merkmal eine starke Trennung zwischen Gruppen anzeigt, was die Dimensionalität reduziert.
Was ist Principal Component Analysis (PCA)?