edit data_gra.tex discussion_gra.tex packages_and_configuration.tex results_gra.tex cds_introduction_data_science_assignment.pdf
add gramic_combined_data.png gramic_hr_data_cleaned.png gramic_sleep_data_cleaned.png gramic_combined_data.png and gramic_sleep_data_data_encoding.pngmaster
parent
3bd4015a79
commit
48106fc820
Binary file not shown.
After Width: | Height: | Size: 33 KiB |
Binary file not shown.
After Width: | Height: | Size: 32 KiB |
Binary file not shown.
After Width: | Height: | Size: 34 KiB |
Binary file not shown.
After Width: | Height: | Size: 103 KiB |
Binary file not shown.
|
@ -3,11 +3,54 @@
|
|||
|
||||
% Preamble
|
||||
\subsection{Datenbeschaffung Michael Graber}
|
||||
\subsubsection{Herausforderungen}
|
||||
\subsubsection{Datenquelle}
|
||||
Quelle waren Daten aus dem Garmin Connect Portal.\\
|
||||
Die Daten selber stammen zu einem kleinen Teil von einer Garmin f\=enix 3 Saphir, einer Garmin Instinct 2 und einer Garmin Instinct 2X.\\
|
||||
Da die Garmin f\=enix 3 Saphir noch keine REM-Daten zur verfügung stellte, konnte nur die Schlafdauer betrachtet werden.\\
|
||||
Eine Mischung aus den f\=enix 3 Saphir Schlafdaten mit Wach-, Leicht- und Tiefschlafphasen und den Instinct 2 / 2X Schlafdaten mit REM-, Wach-, Leicht- und Tiefschlafphasen würde zu einem verfälschten Resultat führen.\\\\
|
||||
Für HR-Daten stellt Garmin keinen csv-Export zur Verfügung.\\
|
||||
Entsprechend musste die Daten manuell aus dem Web GUI von Garmin Connect kopiert werden.\\\\
|
||||
Die Daten der Wochen der Daten korrelieren nicht miteinander.\\
|
||||
Hinzu kommt, dass Garmin Daten aus dem Vorjahr mit dem Jahr angibt, die aus dem aktuellen nicht:\\
|
||||
\\
|
||||
Hinzu kommt, dass das csv als Kommaseparierter Wert angebeben wird,\\
|
||||
\subsubsection{Lösungen}
|
||||
Garmin Connect bietet nur Schlaf- und HR-Daten, die als Wochendurchschnitt gespeichert sind.\\
|
||||
Um Daten pro Tag zu erhalten, müsste auf eine kostenpflichtige API zurückgegriffen werden.
|
||||
\subsubsection{Datenqualität}
|
||||
Die Daten der Wochen der Schlaf- und HR-Daten korrelieren nicht miteinander.\\
|
||||
Hinzu kommt, dass Garmin Daten aus dem Vorjahr mit dem Jahr angibt, die aus dem aktuellen nicht:
|
||||
\begin{figure}[H]
|
||||
\centering
|
||||
\subfloat{{\includegraphics[width=0.43\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_hr_data_dates} }}%
|
||||
\qquad
|
||||
\subfloat{{\includegraphics[width=0.4\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_dates} }}%
|
||||
\caption{ Datumsaufbau HR- und Schlafdaten}
|
||||
\label{fig:gra-date_differences}
|
||||
\end{figure}
|
||||
Hinzu kommt, dass das csv mit den Schlafdaten die Spalten mit einem Komma separierte,
|
||||
das Jahr 2023 wird ebenfalls mit einem Komma getrennt.\\
|
||||
Als resultat haben alle Datensätze ab 2023 eine weitere Spalte.
|
||||
\begin{figure}[H]
|
||||
\centering
|
||||
\includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_data_encoding}
|
||||
\caption{Michael Graber - csv Kodierung}
|
||||
\label{fig:gra-sleep-data-csv-encoding}
|
||||
\end{figure}
|
||||
\subsubsection{Datenbereinigung}
|
||||
Mit einem Python Skript wurden die Daten bereinigt.\\
|
||||
Dazu wurde anhand des Datumsbereichs und dem Jahr (dort wo kein Jahr angegeben wurde, galt das aktuelle Jahr die Kalenderwoche ermittelt.\\
|
||||
So können beide Datensätze miteinander kombiniert werden.\\\\
|
||||
Der nächste Schritt bestand darin, bei den HR-Daten dass \guillemotleft bpm\guillemotright zu entfernen, um die Werte Dezimalzahl umzuwandeln.\\\\
|
||||
In einem nächsten Schritt müssen die Ruhe- und Aktivdaten zu einem Durchschnitt gerechnet werden.\\\\
|
||||
Die so bereinigten Daten werden als csv-Datei zwischengespeichert:
|
||||
\begin{figure}[H]
|
||||
\centering
|
||||
\subfloat{{\includegraphics[width=0.3\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_hr_data_cleaned} }}%
|
||||
\qquad
|
||||
\subfloat{{\includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_cleaned} }}%
|
||||
\caption{ Bereinigte HR- und Schlafdaten}
|
||||
\label{fig:gra-cleaned-datas}
|
||||
\end{figure}
|
||||
In einem letzten Schritt wurden die beiden Datensätze kombiniert und ebenfalls als csv-Datei zwischengespeichert:
|
||||
\begin{figure}[H]
|
||||
\centering
|
||||
\includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_combined_data}
|
||||
\caption{Michael Graber - Kombinierte Daten als csv}
|
||||
\label{fig:gra-combined-data}
|
||||
\end{figure}
|
|
@ -3,3 +3,6 @@
|
|||
|
||||
% Preamble
|
||||
\subsection{Michael Graber}
|
||||
Die Qualität der Datenqualität könnte gesteigert werden, indem die Daten Tageweise gespeichert und verglichen würden.\\
|
||||
Dazu müsste nicht zwangsweise auf die kostenpflichtige API zurückgegriffen werden,\\
|
||||
mithilfe eines Webcrawlers kännten die Daten pro Tag ausgelesen werden.
|
|
@ -47,6 +47,13 @@
|
|||
%\usepackage{calc,pifont,eurosym,amsmath,wasysym,amssymb,amsfonts}
|
||||
\usepackage{calc,pifont,eurosym,amsmath,wasysym,amsfonts}
|
||||
|
||||
% Subplots (um Platz zu sparen)
|
||||
\usepackage{subfig}
|
||||
|
||||
% macron Accent
|
||||
%\usepackage[utf8]{inputenc}
|
||||
%\usepackage[T1]{fontenc}
|
||||
|
||||
\setkomafont{disposition}{\bfseries}
|
||||
|
||||
%-------------------------
|
||||
|
|
|
@ -3,17 +3,19 @@
|
|||
|
||||
% Preamble
|
||||
\subsection{Michael Graber}
|
||||
|
||||
\begin{figure}[H]
|
||||
Zwischen den Kalenderwochen K9 bis KW26 war die jeweilige durchschnittliche Schlafdauer niedriger.\\
|
||||
In diesem Zeitraum befand sich meine Diplomarbeit auf ihrem Höhepunkt.\\
|
||||
Einen direkten Zusammenhang zwischen der Schlafdauer und der durchschnittlichen Herzfrequenz lässt sich in dieser Grafik nicht ausmachen:
|
||||
\begin{figure}[H]
|
||||
\centering
|
||||
\includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_weekly_hr_sleep}
|
||||
\caption{Michael Graber - Durchschnittliche Schlafdauer und Herzfrequenzen}
|
||||
\label{fig:gra-avg-sleep-duration-hr}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[H]
|
||||
\end{figure}
|
||||
Werden die Daten aber in Korrelation zueinander gesetzt, zeigt sich, dass je höher die durchschnittliche Schlafdauer ist, desto tiefer ist die durchschnittliche Herfrequenz:
|
||||
\begin{figure}[H]
|
||||
\centering
|
||||
\includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_hr_correlation}
|
||||
\caption{Korrelation Schlafdauer und Herzfrequenz}
|
||||
\label{fig:gra-corr-sleep-duration-hr}
|
||||
\end{figure}
|
||||
\end{figure}
|
Loading…
Reference in New Issue