Als Basis dieser Analyse diente der Datensatz \("\)UCI Human Activity Recognition (HAR) Dataset\("\)~\cite{jorge_reyes-ortiz_human_2013}.
Dieser enthält Aktivitäten, gelabelt nach Sensordaten von Smartphones (Samsung Galaxy S II). Die Daten stammen von 30 Probanden im Alter von 19 bis 48 Jahren, die sechs vordefinierte Aktivitäten ausführten:
Da der Datensatz hunderte von Features enthält, wurde eine Feature Selection durchgeführt, um die Anzahl der Features zu reduzieren.
Hierzu wurde die Korrelation jedes Features mit der Aktivität berechnet und die 20 Features mit der höchsten positiven und negativen Korrelation ausgewählt.