%! Author = gra %! Date = 01.12.24 % Preamble \section{Forschungsfragen und Methodik}\label{sec:forschungsfragen-und-methodik} Die Forschungsfrage besteht darin, wie zuverlässig können Aktivitäten anhand von Smartphone Sensordaten erkannt werden. Als Basis dieser Analyse diente der Datensatz \("\)UCI Human Activity Recognition (HAR) Dataset\("\)~\cite{jorge_reyes-ortiz_human_2013}. Dieser enthält Aktivitäten, gelabelt nach Sensordaten von Smartphones (Samsung Galaxy S II). Die Daten stammen von 30 Probanden im Alter von 19 bis 48 Jahren, die sechs vordefinierte Aktivitäten ausführten: \begin{itemize} \item WALKING (Gehen) \item WALKING\_UPSTAIRS (Treppe hinaufgehen) \item WALKING\_DOWNSTAIRS (Treppe hinuntergehen) \item SITTING (Sitzen) \item STANDING (Stehen) \item LAYING (Liegen) \end{itemize} Der Datensatz wurde bereits in einen Test und Trainingsset unterteilt, wobei das Trainingsset 70\% und das Testset 30\% der Daten enthält. Eine Datenaufbereitung war jedoch notwending, da manche Features einen für Pandas DataFrame nicht eindeutigen Namen hatten. Beispielsweise wurden die folgenden zwei Features als identisch gewertet: \begin{itemize} \item fBodyGyro-bandsEnergy()-33,40 \item fBodyGyro-bandsEnergy()-41,48 \end{itemize} Da der Datensatz hunderte von Features enthält, wurde eine Feature Selection durchgeführt, um die Anzahl der Features zu reduzieren. Hierzu wurde die Korrelation jedes Features mit der Aktivität berechnet und die 20 Features mit der höchsten positiven und negativen Korrelation ausgewählt. \begin{figure}[H] \centering \includegraphics[width=0.8\textwidth]{../media/corr.png} \caption{Korrelation der Features mit der Aktivität}\label{fig:figure} \end{figure} Damit wurden 3 Modelle trainiert und mit dem F1-Score evaluiert: \begin{figure}[H] \centering \includegraphics[width=0.8\textwidth]{../media/models.png} \caption{Modelle und deren F1-Score}\label{fig:figure2} \end{figure}