LaTEX final lecture commit
parent
77ba7fe25e
commit
de6295282c
Binary file not shown.
|
@ -3,10 +3,10 @@
|
|||
|
||||
% Preamble
|
||||
\section{Einleitung}\label{sec: einleitung}
|
||||
Moderne Smartwatches wie die Apple Watch erkennen, ob sich der Träger bewegt und schlägt ein Workout vor, dass es klassifiziert hat.\\
|
||||
Moderne Smartwatches wie die Apple Watch erkennen, ob sich der Träger bewegt und schlägt ein Workout vor, das es klassifiziert hat.\\
|
||||
Aber auch Wearables wie Kopfhörer sind in der Lage zu erkennen, ob der Träger aufsteht und anfängt zu laufen.\\
|
||||
Je nach Präferenz können die Kopfhörer dann z.B.\ den Noise canceling Mode verlassen.\\\\
|
||||
Nicht jede*r trägt eine Smartwatch oder ein anderes Wearable auf sich, die allermeisten führen auf aber ein Smartphone mit sich.\\
|
||||
Nicht jede*r trägt eine Smartwatch oder ein anderes Wearable an sich, die allermeisten führen aber ein Smartphone mit sich.\\
|
||||
Smartphones sind auch mit diversen Sensoren bestückt.\\
|
||||
Allerdings variiert die Anzahl, Qualität und Art der verbauten Sensoren stark zwischen den Herstellern und deren Modellen und Preisklassen.\\
|
||||
Daher stellt sich die Frage, ob die Daten für eine Vorhersage ausreichen.
|
||||
|
|
|
@ -4,7 +4,7 @@
|
|||
% Preamble
|
||||
|
||||
\section{Forschungsfragen und Methodik}\label{sec:forschungsfragen-und-methodik}
|
||||
Die Forschungsfrage lautet, wie zuverlässig können Aktivitäten anhand von Smartphone Sensordaten erkannt werden.
|
||||
Die Forschungsfrage besteht darin, wie zuverlässig können Aktivitäten anhand von Smartphone Sensordaten erkannt werden.
|
||||
|
||||
Als Basis dieser Analyse diente der Datensatz \("\)UCI Human Activity Recognition (HAR) Dataset\("\)~\cite{jorge_reyes-ortiz_human_2013}.
|
||||
Dieser enthält Aktivitäten, gelabelt nach Sensordaten von Smartphones (Samsung Galaxy S II). Die Daten stammen von 30 Probanden im Alter von 19 bis 48 Jahren, die sechs vordefinierte Aktivitäten ausführten:
|
||||
|
@ -19,23 +19,24 @@ Dieser enthält Aktivitäten, gelabelt nach Sensordaten von Smartphones (Samsung
|
|||
\end{itemize}
|
||||
|
||||
Der Datensatz wurde bereits in einen Test und Trainingsset unterteilt, wobei das Trainingsset 70\% und das Testset 30\% der Daten enthält.
|
||||
Eine Datenaufbereitung war jedoch notwending, da manche Features einen für Pandas nicht eindeutigen Namen hatten.
|
||||
Die folgenden zwei Features wurden als identisch gewertet:
|
||||
Eine Datenaufbereitung war jedoch notwending, da manche Features einen für Pandas DataFrame nicht eindeutigen Namen hatten.
|
||||
Beispielsweise wurden die folgenden zwei Features als identisch gewertet:
|
||||
\begin{itemize}
|
||||
\item fBodyGyro-bandsEnergy()-33,40
|
||||
\item fBodyGyro-bandsEnergy()-41,48
|
||||
\end{itemize}
|
||||
|
||||
Da der Datensatz eine hohe anzahl an Features enthält, wurde eine Feature Selection durchgeführt, um die Anzahl der Features zu reduzieren. Hierzu wurde die Korrelation jedes Features mit der Aktivität berechnet und die 20 Features mit der höchsten positiven und negativen Korrelation ausgewählt.
|
||||
Da der Datensatz hunderte von Features enthält, wurde eine Feature Selection durchgeführt, um die Anzahl der Features zu reduzieren.
|
||||
Hierzu wurde die Korrelation jedes Features mit der Aktivität berechnet und die 20 Features mit der höchsten positiven und negativen Korrelation ausgewählt.
|
||||
\begin{figure}[H]
|
||||
\centering
|
||||
\includegraphics[width=0.8\textwidth]{../media/corr.png}
|
||||
\caption{Korrelation der Features mit der Aktivität}
|
||||
\caption{Korrelation der Features mit der Aktivität}\label{fig:figure}
|
||||
\end{figure}
|
||||
|
||||
Damit wurden 3 Modelle trainiert und mit dem F1-Score evaluiert:
|
||||
\begin{figure}[H]
|
||||
\centering
|
||||
\includegraphics[width=0.8\textwidth]{../media/models.png}
|
||||
\caption{Modelle und deren F1-Score}
|
||||
\caption{Modelle und deren F1-Score}\label{fig:figure2}
|
||||
\end{figure}
|
||||
|
|
|
@ -3,6 +3,9 @@
|
|||
|
||||
% Preamble
|
||||
\section{Resultate}\label{sec:resultate}
|
||||
Mit den drei verwendeten Modellen lässt eine Vorhersage der Aktivitäten realisieren.
|
||||
Allerdings unterscheiden sie sich bei der Genauigkeit der Vorhersage.\\
|
||||
Der Decision Tree schneidet mit einem F1-Score von 0,58 am schlechtesten ab, da er im Vergleich zu komplexeren Modellen wie dem Random Forest eher anfällig für Overfitting ist und weniger robuste Entscheidungsregeln bildet.
|
||||
Der Random Forest und KNN haben mit rund 0,68 einen ähnlichen F1-Score. Der Random Forest Algorithmus liefert durch die Kombination vieler Entscheidungsbäume stabilere Vorhersagen, der KNN-Algorithmus dagegen ist auch anfällig für Overfitting, was ihn etwas schlechter abschneiden lässt als Random Forest.
|
||||
Der Random Forest und KNN haben mit rund 0,68 einen ähnlichen F1-Score.
|
||||
Der Random Forest Algorithmus liefert durch die Kombination vieler Entscheidungsbäume stabilere Vorhersagen, der KNN-Algorithmus dagegen ist auch anfällig für Overfitting.
|
||||
Insgesamt liefert der Random Forest tendenziell die besten Ergebnisse.
|
||||
|
|
|
@ -3,6 +3,6 @@
|
|||
|
||||
% Preamble
|
||||
\section{Stand der Forschung}\label{sec: stand-der-forschung}
|
||||
Human Activity Recognition (HAR) ist der Versuch, anhand von Sensordaten die aktivität einer Person zu bestimmen bzw. vorherzusagen~\cite{brownlee_gentle_2018}.\\
|
||||
Hierzu werden oft Convolutional Neural Network (CNN) verwendet~\cite{sikder_human_2021, brownlee_gentle_2018}, manchmal wird aber auch Machine Learning~\cite{alagoz_comparative_2024} verwendet.\\
|
||||
Human Activity Recognition (HAR) ist der Versuch, anhand von Sensordaten die Aktivität einer Person zu bestimmen bzw. vorherzusagen~\cite{brownlee_gentle_2018}.\\
|
||||
Hierzu werden oft Convolutional Neural Network (CNN) verwendet~\cite{sikder_human_2021, brownlee_gentle_2018}, manchmal wird aber auch auf Machine Learning~\cite{alagoz_comparative_2024} zurückgegriffen.\\
|
||||
Ein allgemein beschriebenes Problem besteht darin, dass Menschen heterogene Aktivitäten ausführen und die Sensordaten sich selbst bei gleicher Aktivität und gleicher Sensorqualität unterscheiden können.
|
||||
|
|
|
@ -6,7 +6,7 @@
|
|||
\subtitle{Anwendung und Vergleich von Random Forest, KNN und DecisionTrees auf dem UCI HAR Datensatz}
|
||||
\author[1,*]{Oliver Schütz}
|
||||
\author[2,*]{Michael Graber}
|
||||
\affil[1]{Fachhochschule Graubünden}
|
||||
\affil[1,2]{Fachhochschule Graubünden}
|
||||
\affil[*]{E-Mail Adressen: oliver.schuetz@stud.fhgr.ch, michael.graber@stud.fhgr.ch}
|
||||
\date{\today}
|
||||
\maketitle
|
||||
|
|
Loading…
Reference in New Issue