edit data_gra.tex discussion_gra.tex packages_and_configuration.tex results_gra.tex cds_introduction_data_science_assignment.pdf

add gramic_combined_data.png gramic_hr_data_cleaned.png gramic_sleep_data_cleaned.png gramic_combined_data.png and gramic_sleep_data_data_encoding.png
master
TheOriginalGraLargeShrimpakaReaper 2024-10-26 23:48:47 +02:00
parent 3bd4015a79
commit 48106fc820
9 changed files with 75 additions and 20 deletions

Binary file not shown.

After

Width:  |  Height:  |  Size: 33 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 32 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 34 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 103 KiB

View File

@ -3,11 +3,54 @@
% Preamble % Preamble
\subsection{Datenbeschaffung Michael Graber} \subsection{Datenbeschaffung Michael Graber}
\subsubsection{Herausforderungen} \subsubsection{Datenquelle}
Quelle waren Daten aus dem Garmin Connect Portal.\\
Die Daten selber stammen zu einem kleinen Teil von einer Garmin f\=enix 3 Saphir, einer Garmin Instinct 2 und einer Garmin Instinct 2X.\\
Da die Garmin f\=enix 3 Saphir noch keine REM-Daten zur verfügung stellte, konnte nur die Schlafdauer betrachtet werden.\\
Eine Mischung aus den f\=enix 3 Saphir Schlafdaten mit Wach-, Leicht- und Tiefschlafphasen und den Instinct 2 / 2X Schlafdaten mit REM-, Wach-, Leicht- und Tiefschlafphasen würde zu einem verfälschten Resultat führen.\\\\
Für HR-Daten stellt Garmin keinen csv-Export zur Verfügung.\\ Für HR-Daten stellt Garmin keinen csv-Export zur Verfügung.\\
Entsprechend musste die Daten manuell aus dem Web GUI von Garmin Connect kopiert werden.\\\\ Entsprechend musste die Daten manuell aus dem Web GUI von Garmin Connect kopiert werden.\\\\
Die Daten der Wochen der Daten korrelieren nicht miteinander.\\ Garmin Connect bietet nur Schlaf- und HR-Daten, die als Wochendurchschnitt gespeichert sind.\\
Hinzu kommt, dass Garmin Daten aus dem Vorjahr mit dem Jahr angibt, die aus dem aktuellen nicht:\\ Um Daten pro Tag zu erhalten, müsste auf eine kostenpflichtige API zurückgegriffen werden.
\\ \subsubsection{Datenqualität}
Hinzu kommt, dass das csv als Kommaseparierter Wert angebeben wird,\\ Die Daten der Wochen der Schlaf- und HR-Daten korrelieren nicht miteinander.\\
\subsubsection{Lösungen} Hinzu kommt, dass Garmin Daten aus dem Vorjahr mit dem Jahr angibt, die aus dem aktuellen nicht:
\begin{figure}[H]
\centering
\subfloat{{\includegraphics[width=0.43\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_hr_data_dates} }}%
\qquad
\subfloat{{\includegraphics[width=0.4\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_dates} }}%
\caption{ Datumsaufbau HR- und Schlafdaten}
\label{fig:gra-date_differences}
\end{figure}
Hinzu kommt, dass das csv mit den Schlafdaten die Spalten mit einem Komma separierte,
das Jahr 2023 wird ebenfalls mit einem Komma getrennt.\\
Als resultat haben alle Datensätze ab 2023 eine weitere Spalte.
\begin{figure}[H]
\centering
\includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_data_encoding}
\caption{Michael Graber - csv Kodierung}
\label{fig:gra-sleep-data-csv-encoding}
\end{figure}
\subsubsection{Datenbereinigung}
Mit einem Python Skript wurden die Daten bereinigt.\\
Dazu wurde anhand des Datumsbereichs und dem Jahr (dort wo kein Jahr angegeben wurde, galt das aktuelle Jahr die Kalenderwoche ermittelt.\\
So können beide Datensätze miteinander kombiniert werden.\\\\
Der nächste Schritt bestand darin, bei den HR-Daten dass \guillemotleft bpm\guillemotright zu entfernen, um die Werte Dezimalzahl umzuwandeln.\\\\
In einem nächsten Schritt müssen die Ruhe- und Aktivdaten zu einem Durchschnitt gerechnet werden.\\\\
Die so bereinigten Daten werden als csv-Datei zwischengespeichert:
\begin{figure}[H]
\centering
\subfloat{{\includegraphics[width=0.3\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_hr_data_cleaned} }}%
\qquad
\subfloat{{\includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_cleaned} }}%
\caption{ Bereinigte HR- und Schlafdaten}
\label{fig:gra-cleaned-datas}
\end{figure}
In einem letzten Schritt wurden die beiden Datensätze kombiniert und ebenfalls als csv-Datei zwischengespeichert:
\begin{figure}[H]
\centering
\includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_combined_data}
\caption{Michael Graber - Kombinierte Daten als csv}
\label{fig:gra-combined-data}
\end{figure}

View File

@ -3,3 +3,6 @@
% Preamble % Preamble
\subsection{Michael Graber} \subsection{Michael Graber}
Die Qualität der Datenqualität könnte gesteigert werden, indem die Daten Tageweise gespeichert und verglichen würden.\\
Dazu müsste nicht zwangsweise auf die kostenpflichtige API zurückgegriffen werden,\\
mithilfe eines Webcrawlers kännten die Daten pro Tag ausgelesen werden.

View File

@ -47,6 +47,13 @@
%\usepackage{calc,pifont,eurosym,amsmath,wasysym,amssymb,amsfonts} %\usepackage{calc,pifont,eurosym,amsmath,wasysym,amssymb,amsfonts}
\usepackage{calc,pifont,eurosym,amsmath,wasysym,amsfonts} \usepackage{calc,pifont,eurosym,amsmath,wasysym,amsfonts}
% Subplots (um Platz zu sparen)
\usepackage{subfig}
% macron Accent
%\usepackage[utf8]{inputenc}
%\usepackage[T1]{fontenc}
\setkomafont{disposition}{\bfseries} \setkomafont{disposition}{\bfseries}
%------------------------- %-------------------------

View File

@ -3,17 +3,19 @@
% Preamble % Preamble
\subsection{Michael Graber} \subsection{Michael Graber}
Zwischen den Kalenderwochen K9 bis KW26 war die jeweilige durchschnittliche Schlafdauer niedriger.\\
\begin{figure}[H] In diesem Zeitraum befand sich meine Diplomarbeit auf ihrem Höhepunkt.\\
\centering Einen direkten Zusammenhang zwischen der Schlafdauer und der durchschnittlichen Herzfrequenz lässt sich in dieser Grafik nicht ausmachen:
\includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_weekly_hr_sleep} \begin{figure}[H]
\caption{Michael Graber - Durchschnittliche Schlafdauer und Herzfrequenzen} \centering
\label{fig:gra-avg-sleep-duration-hr} \includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_weekly_hr_sleep}
\end{figure} \caption{Michael Graber - Durchschnittliche Schlafdauer und Herzfrequenzen}
\label{fig:gra-avg-sleep-duration-hr}
\begin{figure}[H] \end{figure}
\centering Werden die Daten aber in Korrelation zueinander gesetzt, zeigt sich, dass je höher die durchschnittliche Schlafdauer ist, desto tiefer ist die durchschnittliche Herfrequenz:
\includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_hr_correlation} \begin{figure}[H]
\caption{Korrelation Schlafdauer und Herzfrequenz} \centering
\label{fig:gra-corr-sleep-duration-hr} \includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_hr_correlation}
\end{figure} \caption{Korrelation Schlafdauer und Herzfrequenz}
\label{fig:gra-corr-sleep-duration-hr}
\end{figure}