diff --git a/media/gra/gramic_combined_data.png b/media/gra/gramic_combined_data.png new file mode 100644 index 0000000..6116526 Binary files /dev/null and b/media/gra/gramic_combined_data.png differ diff --git a/media/gra/gramic_hr_data_cleaned.png b/media/gra/gramic_hr_data_cleaned.png new file mode 100644 index 0000000..f20ce7c Binary files /dev/null and b/media/gra/gramic_hr_data_cleaned.png differ diff --git a/media/gra/gramic_sleep_data_cleaned.png b/media/gra/gramic_sleep_data_cleaned.png new file mode 100644 index 0000000..a6bf8c6 Binary files /dev/null and b/media/gra/gramic_sleep_data_cleaned.png differ diff --git a/media/gra/gramic_sleep_data_data_encoding.png b/media/gra/gramic_sleep_data_data_encoding.png new file mode 100644 index 0000000..6d67fa6 Binary files /dev/null and b/media/gra/gramic_sleep_data_data_encoding.png differ diff --git a/out/cds_introduction_data_science_assignment.pdf b/out/cds_introduction_data_science_assignment.pdf index 3bae6fd..7be9e2f 100644 Binary files a/out/cds_introduction_data_science_assignment.pdf and b/out/cds_introduction_data_science_assignment.pdf differ diff --git a/term-paper/data_gra.tex b/term-paper/data_gra.tex index 37941f1..1aac65d 100644 --- a/term-paper/data_gra.tex +++ b/term-paper/data_gra.tex @@ -3,11 +3,54 @@ % Preamble \subsection{Datenbeschaffung Michael Graber} -\subsubsection{Herausforderungen} +\subsubsection{Datenquelle} +Quelle waren Daten aus dem Garmin Connect Portal.\\ +Die Daten selber stammen zu einem kleinen Teil von einer Garmin f\=enix 3 Saphir, einer Garmin Instinct 2 und einer Garmin Instinct 2X.\\ +Da die Garmin f\=enix 3 Saphir noch keine REM-Daten zur verfügung stellte, konnte nur die Schlafdauer betrachtet werden.\\ +Eine Mischung aus den f\=enix 3 Saphir Schlafdaten mit Wach-, Leicht- und Tiefschlafphasen und den Instinct 2 / 2X Schlafdaten mit REM-, Wach-, Leicht- und Tiefschlafphasen würde zu einem verfälschten Resultat führen.\\\\ Für HR-Daten stellt Garmin keinen csv-Export zur Verfügung.\\ Entsprechend musste die Daten manuell aus dem Web GUI von Garmin Connect kopiert werden.\\\\ -Die Daten der Wochen der Daten korrelieren nicht miteinander.\\ -Hinzu kommt, dass Garmin Daten aus dem Vorjahr mit dem Jahr angibt, die aus dem aktuellen nicht:\\ -\\ -Hinzu kommt, dass das csv als Kommaseparierter Wert angebeben wird,\\ -\subsubsection{Lösungen} +Garmin Connect bietet nur Schlaf- und HR-Daten, die als Wochendurchschnitt gespeichert sind.\\ +Um Daten pro Tag zu erhalten, müsste auf eine kostenpflichtige API zurückgegriffen werden. +\subsubsection{Datenqualität} +Die Daten der Wochen der Schlaf- und HR-Daten korrelieren nicht miteinander.\\ +Hinzu kommt, dass Garmin Daten aus dem Vorjahr mit dem Jahr angibt, die aus dem aktuellen nicht: +\begin{figure}[H] + \centering + \subfloat{{\includegraphics[width=0.43\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_hr_data_dates} }}% + \qquad + \subfloat{{\includegraphics[width=0.4\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_dates} }}% + \caption{ Datumsaufbau HR- und Schlafdaten} + \label{fig:gra-date_differences} +\end{figure} +Hinzu kommt, dass das csv mit den Schlafdaten die Spalten mit einem Komma separierte, +das Jahr 2023 wird ebenfalls mit einem Komma getrennt.\\ +Als resultat haben alle Datensätze ab 2023 eine weitere Spalte. +\begin{figure}[H] + \centering + \includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_data_encoding} + \caption{Michael Graber - csv Kodierung} + \label{fig:gra-sleep-data-csv-encoding} +\end{figure} +\subsubsection{Datenbereinigung} +Mit einem Python Skript wurden die Daten bereinigt.\\ +Dazu wurde anhand des Datumsbereichs und dem Jahr (dort wo kein Jahr angegeben wurde, galt das aktuelle Jahr die Kalenderwoche ermittelt.\\ +So können beide Datensätze miteinander kombiniert werden.\\\\ +Der nächste Schritt bestand darin, bei den HR-Daten dass \guillemotleft bpm\guillemotright zu entfernen, um die Werte Dezimalzahl umzuwandeln.\\\\ +In einem nächsten Schritt müssen die Ruhe- und Aktivdaten zu einem Durchschnitt gerechnet werden.\\\\ +Die so bereinigten Daten werden als csv-Datei zwischengespeichert: +\begin{figure}[H] + \centering + \subfloat{{\includegraphics[width=0.3\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_hr_data_cleaned} }}% + \qquad + \subfloat{{\includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_cleaned} }}% + \caption{ Bereinigte HR- und Schlafdaten} + \label{fig:gra-cleaned-datas} +\end{figure} +In einem letzten Schritt wurden die beiden Datensätze kombiniert und ebenfalls als csv-Datei zwischengespeichert: +\begin{figure}[H] + \centering + \includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_combined_data} + \caption{Michael Graber - Kombinierte Daten als csv} + \label{fig:gra-combined-data} +\end{figure} \ No newline at end of file diff --git a/term-paper/discussion_gra.tex b/term-paper/discussion_gra.tex index a24cefa..208af77 100644 --- a/term-paper/discussion_gra.tex +++ b/term-paper/discussion_gra.tex @@ -3,3 +3,6 @@ % Preamble \subsection{Michael Graber} +Die Qualität der Datenqualität könnte gesteigert werden, indem die Daten Tageweise gespeichert und verglichen würden.\\ +Dazu müsste nicht zwangsweise auf die kostenpflichtige API zurückgegriffen werden,\\ +mithilfe eines Webcrawlers kännten die Daten pro Tag ausgelesen werden. \ No newline at end of file diff --git a/term-paper/packages_and_configuration.tex b/term-paper/packages_and_configuration.tex index 0aa1ede..18aab0c 100644 --- a/term-paper/packages_and_configuration.tex +++ b/term-paper/packages_and_configuration.tex @@ -47,6 +47,13 @@ %\usepackage{calc,pifont,eurosym,amsmath,wasysym,amssymb,amsfonts} \usepackage{calc,pifont,eurosym,amsmath,wasysym,amsfonts} +% Subplots (um Platz zu sparen) +\usepackage{subfig} + +% macron Accent +%\usepackage[utf8]{inputenc} +%\usepackage[T1]{fontenc} + \setkomafont{disposition}{\bfseries} %------------------------- diff --git a/term-paper/results_gra.tex b/term-paper/results_gra.tex index fb74aa1..74b919f 100644 --- a/term-paper/results_gra.tex +++ b/term-paper/results_gra.tex @@ -3,17 +3,19 @@ % Preamble \subsection{Michael Graber} - - \begin{figure}[H] - \centering - \includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_weekly_hr_sleep} - \caption{Michael Graber - Durchschnittliche Schlafdauer und Herzfrequenzen} - \label{fig:gra-avg-sleep-duration-hr} - \end{figure} - - \begin{figure}[H] - \centering - \includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_hr_correlation} - \caption{Korrelation Schlafdauer und Herzfrequenz} - \label{fig:gra-corr-sleep-duration-hr} - \end{figure} \ No newline at end of file +Zwischen den Kalenderwochen K9 bis KW26 war die jeweilige durchschnittliche Schlafdauer niedriger.\\ +In diesem Zeitraum befand sich meine Diplomarbeit auf ihrem Höhepunkt.\\ +Einen direkten Zusammenhang zwischen der Schlafdauer und der durchschnittlichen Herzfrequenz lässt sich in dieser Grafik nicht ausmachen: +\begin{figure}[H] + \centering + \includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_weekly_hr_sleep} + \caption{Michael Graber - Durchschnittliche Schlafdauer und Herzfrequenzen} + \label{fig:gra-avg-sleep-duration-hr} +\end{figure} +Werden die Daten aber in Korrelation zueinander gesetzt, zeigt sich, dass je höher die durchschnittliche Schlafdauer ist, desto tiefer ist die durchschnittliche Herfrequenz: +\begin{figure}[H] + \centering + \includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_hr_correlation} + \caption{Korrelation Schlafdauer und Herzfrequenz} + \label{fig:gra-corr-sleep-duration-hr} +\end{figure} \ No newline at end of file