diff --git a/media/fredy/fredy_sleep_duration_hr.png b/media/fredy/fredy_sleep_duration_hr.png new file mode 100644 index 0000000..f6769db Binary files /dev/null and b/media/fredy/fredy_sleep_duration_hr.png differ diff --git a/media/fredy/fredy_sleep_quality_hr.png b/media/fredy/fredy_sleep_quality_hr.png new file mode 100644 index 0000000..9529bb4 Binary files /dev/null and b/media/fredy/fredy_sleep_quality_hr.png differ diff --git a/out/cds_introduction_data_science_assignment.pdf b/out/cds_introduction_data_science_assignment.pdf index a7d20f1..fe47bf5 100644 Binary files a/out/cds_introduction_data_science_assignment.pdf and b/out/cds_introduction_data_science_assignment.pdf differ diff --git a/term-paper/cds_introduction_data_science_assignment.tex b/term-paper/cds_introduction_data_science_assignment.tex index 6da2e72..2bd6f68 100644 --- a/term-paper/cds_introduction_data_science_assignment.tex +++ b/term-paper/cds_introduction_data_science_assignment.tex @@ -24,7 +24,7 @@ \input{title} %\begin{multicols}{2} -\input{introduction} +%\input{introduction} %\citeauthor{Student2022} führt aus Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua \cite{Student2022}. \section{Forschungsfragen und Methodik}\label{sec:forschungsfragen-und-methodik} diff --git a/term-paper/data_fredy.tex b/term-paper/data_fredy.tex index 92ab019..d26a71b 100644 --- a/term-paper/data_fredy.tex +++ b/term-paper/data_fredy.tex @@ -2,3 +2,6 @@ %! Date = 24.10.24 % Preamble +\subsection{Datenbeschaffung Frederic}\label{subsec:datenbeschaffung-frederic} +Dieser Datensatz basiert auf dem Sleep Health and Lifestyle Dataset auf \href{https://www.kaggle.com/datasets/uom190346a/sleep-health-and-lifestyle-dataset}{Sleep Health and Lifestyle Dataset auf Kaggle}. +Zu den Details gehören unter anderem das Geschlecht, Alter, Beruf, Schlafdauer, Schlafqualität, körperliche Aktivität, Stresslevel, BMI-Kategorie, Blutdruck, Herzfrequenz, tägliche Schritte und das Vorliegen von Schlafstörungen. diff --git a/term-paper/data_gra.tex b/term-paper/data_gra.tex index 28db594..6e5075c 100644 --- a/term-paper/data_gra.tex +++ b/term-paper/data_gra.tex @@ -2,7 +2,7 @@ %! Date = 24.10.24 % Preamble -\subsection{Datenbeschaffung Michael Graber}\label{subsec:datenbeschaffung-michael-graber} +\subsection{Datenbeschaffung Michael}\label{subsec:datenbeschaffung-michael-graber} \subsubsection{Datenquelle} Quelle waren Daten aus dem Garmin Connect Portal.\\ Die Daten selber stammen zu einem kleinen Teil von einer Garmin f\=enix 3 Saphir HR, einer Garmin Instinct Solar 2 und einer Garmin Instinct Solar 2X.\\ @@ -17,15 +17,15 @@ Garmin Connect bietet nur Schlaf- und HR-Daten, die als Wochendurchschnitt gespe %Um Daten pro Tag zu erhalten, müsste auf eine kostenpflichtige API zurückgegriffen werden. \subsubsection{Datenqualität} Die Daten der Wochen der Schlaf- und HR-Daten korrelieren nicht miteinander.\\ -Hinzu kommt, dass Garmin Daten aus dem Vorjahr mit dem Jahr angibt, die aus dem aktuellen nicht: -\begin{figure}[H] - \centering - \subfloat{{\includegraphics[width=0.43\linewidth]{../media/gra/gramic_hr_data_dates} }}% - \qquad - \subfloat{{\includegraphics[width=0.4\linewidth]{../media/gra/gramic_sleep_data_dates} }}% - \caption{ Datumsaufbau HR- und Schlafdaten} - \label{fig:gra-date_differences} -\end{figure} +Hinzu kommt, dass Garmin Daten aus dem Vorjahr mit dem Jahr angibt, die aus dem aktuellen nicht.%: +%\begin{figure}[H] +% \centering +% \subfloat{{\includegraphics[width=0.43\linewidth]{../media/gra/gramic_hr_data_dates} }}% +% \qquad +% \subfloat{{\includegraphics[width=0.4\linewidth]{../media/gra/gramic_sleep_data_dates} }}% +% \caption{ Datumsaufbau HR- und Schlafdaten} +% \label{fig:gra-date_differences} +%\end{figure} Des Weiteren ist das csv mit den Schlafdaten Kommasepariert, das Jahr 2023 wird ebenfalls mit einem Komma getrennt. Als resultat haben alle Datensätze ab 2023 eine weitere Spalte. @@ -41,15 +41,15 @@ Dazu wurde anhand des Datumsbereichs und dem Jahr (dort wo kein Jahr angegeben w So können beide Datensätze miteinander kombiniert werden.\\ Der nächste Schritt bestand darin, bei den HR-Daten, dass \guillemotleft bpm\guillemotright zu entfernen, um die Werte Dezimalzahl umzuwandeln.\\ In einem nächsten Schritt müssen die Ruhe- und Aktivdaten zu einem Durchschnitt gerechnet werden. -Die so bereinigten Daten werden als csv-Datei zwischengespeichert: -\begin{figure}[H] - \centering - \subfloat{{\includegraphics[width=0.3\linewidth]{../media/gra/gramic_hr_data_cleaned} }}% - \qquad - \subfloat{{\includegraphics[width=0.5\linewidth]{../media/gra/gramic_sleep_data_cleaned} }}% - \caption{ Bereinigte HR- und Schlafdaten} - \label{fig:gra-cleaned-datas} -\end{figure} +Die so bereinigten Daten werden als csv-Datei zwischengespeichert.%: +%\begin{figure}[H] +% \centering +% \subfloat{{\includegraphics[width=0.3\linewidth]{../media/gra/gramic_hr_data_cleaned} }}% +% \qquad +% \subfloat{{\includegraphics[width=0.5\linewidth]{../media/gra/gramic_sleep_data_cleaned} }}% +% \caption{ Bereinigte HR- und Schlafdaten} +% \label{fig:gra-cleaned-datas} +%\end{figure} In einem letzten Schritt wurden die beiden Datensätze kombiniert und ebenfalls als csv-Datei zwischengespeichert.%: %\begin{figure}[H] % \centering diff --git a/term-paper/data_oli.tex b/term-paper/data_oli.tex index 1d8fbc2..648c39c 100644 --- a/term-paper/data_oli.tex +++ b/term-paper/data_oli.tex @@ -3,23 +3,10 @@ % Preamble -\subsection{Daten Oliver} - -\subsubsection{Beschaffung} -Zur Aufzeichnung meiner Daten habe ich eine \texttt{'Withings Steel HR Sport'} Uhr verwendet. Damit habe ich von August bis Oktober Schlafdaten und den Tagespuls erfasst. Diese Daten werden in der App visualisiert und sind dort zugänglich. Für den Schlaf erhält man einen Sleep Score, die verschiedenen Schlafphasen, den Puls während des Schlafs, die Dauer, den Start- und Endzeitpunkt sowie Unterbrechungen. - -Für den Tagespuls sieht man für jeden Tag eine Kurve mit dem Verlauf, dem Minimum, Maximum und Durchschnitt. Um die Daten in einem verarbeitbaren Format zu erhalten, habe ich in der App eine E-Mail-Anfrage gestellt, um meine Daten herunterzuladen. Diese wurden mir als ZIP-Datei per E-Mail zugeschickt. Die ZIP-Datei enthält mehrere CSV-Dateien mit verschiedenen Daten, von denen die meisten Metadaten oder leere Tabellen sind. Die beiden Tabellen, die für meine Analyse relevant sind, enthalten die zuvor genannten Spalten. - -\subsubsection{Aufbereitung} -Zunächst werden beide Tabellen in ein Pandas DataFrame eingelesen. - -Beginnend mit den Schlafdaten: -Da der Zeitpunkt des Schlafs in keinem geeigneten Format vorlag, wurde der Endzeitpunkt als Datum des Schlafs verwendet. Die Dauer wurde aus der Summe aller Schlafphasen berechnet und von Sekunden in Stunden umgerechnet. Da der Einfluss auf den nächsten Tag untersucht werden soll, wurde das Folgedatum dem Tagespuls zugeordnet. - -Für den Tagespuls: -Die Werte für den Puls lagen nicht im Integer-Format vor, sondern als String mit einem Array. Dieses Array musste in einzelne Zahlenwerte aufgespalten werden, wobei für jedes Element des Arrays eine neue Zeile erzeugt wurde. Danach wurden alle Werte nach Datum gruppiert und daraus der Durchschnitt pro Tag berechnet. - -Abschließend wurden beide Tabellen anhand des Datums zusammengeführt und fehlerhafte Werte aus dem Datensatz entfernt. +\subsection{Daten Oliver}\label{subsec:daten-oliver} +\subsubsection{Beschaffung} Die Datenaufzeichnung erfolgte mit der \texttt{'Withings Steel HR Sport'} Uhr, die Schlafdaten und die Herzfrequenz am Tag im Zeitraum von August bis Oktober erfasste. +Der Export der Daten wurde über die App durchgeführt, indem eine Datenanfrage gestellt wurde; die Daten kamen per E-Mail als ZIP-Datei mit mehreren CSV-Dateien an. +\subsubsection{Aufbereitung} Die Werte wurden in kompatible Datentypen umgewandelt und mehrere Tages- und Schlafaufzeichnungen zu einem einheitlichen Datensatz zusammengefasst. Anschließend wurden beide Tabellen anhand des Datums zusammengeführt, und fehlerhafte Werte aus dem Datensatz entfernt. diff --git a/term-paper/discussion_gra.tex b/term-paper/discussion_gra.tex index 601d35a..eb377ce 100644 --- a/term-paper/discussion_gra.tex +++ b/term-paper/discussion_gra.tex @@ -2,7 +2,7 @@ %! Date = 24.10.24 % Preamble -\subsection{Michael Graber}\label{subsec:michael-graber2} +\subsection{Michael}\label{subsec:michael-graber2} Die Qualität der Datenqualität könnte gesteigert werden, indem die Daten Tageweise gespeichert und verglichen würden.\\ Dazu müsste nicht zwangsweise auf die kostenpflichtige API zurückgegriffen werden,\\ mithilfe eines Webcrawlers kännten die Daten pro Tag ausgelesen werden. \ No newline at end of file diff --git a/term-paper/discussion_oli.tex b/term-paper/discussion_oli.tex index ac2303f..72123a5 100644 --- a/term-paper/discussion_oli.tex +++ b/term-paper/discussion_oli.tex @@ -2,11 +2,7 @@ %! Date = 24.10.24 % Preamble -\subsection{Oliver} -Trotz leichter Korrelation gibt es bei diesem Vorgehen viele Fehlerquellen. Die Datenmenge war recht klein, und da meine Schlafzeiten relativ konsistent waren und ich durchschnittlich einen sehr hohen Sleep Score (circa 90) hatte, fehlt größtenteils das untere Spektrum. - +\subsection{Oliver}\label{subsec:oliver} +Trotz leichter Korrelation gibt es bei diesem Vorgehen viele Fehlerquellen. +Die Datenmenge war recht klein, und da meine Schlafzeiten relativ konsistent waren und ich durchschnittlich einen sehr hohen Sleep Score (circa 90) hatte, fehlt größtenteils das untere Spektrum. Zudem beziehen sich die Daten nur auf eine Person, sodass es möglich ist, dass der Einfluss des Schlafs bei mir stärker ausgeprägt ist als bei anderen. - -Der Einfluss des Schlafs auf die Gesundheit ist bereits umfassend erforscht, und es wurde ein Zusammenhang zwischen Schlafmangel und Schlaganfällen festgestellt \cite{wolk_sleep_2005}. Dies bestätigt die Annahme, dass die Schlafqualität langfristig einen Einfluss auf den Puls haben kann. - -Es ist jedoch schwierig, den Puls des nächsten Tages genau vorherzusagen, da dieser auch durch andere Faktoren wie Koffein, Sport, Stress etc. beeinflusst werden kann \cite{valentini_variables_2009}. diff --git a/term-paper/introduction.tex b/term-paper/introduction.tex index f5eb779..00f4db8 100644 --- a/term-paper/introduction.tex +++ b/term-paper/introduction.tex @@ -3,4 +3,4 @@ % Preamble \section{Einleitung}\label{sec: einleitung} -Im Rahmen des Kurses Einführung in Computational und Data Science erhie \ No newline at end of file +Im Rahmen des Kurses Einführung in Computational und Data Science erhielten wir den Auftrag, eine Forschungsfrage zu erarbeiten und anhand eigener Fitnessdaten (oder einem Beispieldatensatz), Korrelatione zu ermitteln und Visualisieren. diff --git a/term-paper/relevance.tex b/term-paper/relevance.tex index b8c10af..1102fcf 100644 --- a/term-paper/relevance.tex +++ b/term-paper/relevance.tex @@ -5,4 +5,6 @@ \section{Stand der Forschung}\label{sec: stand-der-forschung} Im Jahr 2011 wurde an der Universität Isfahan und am Spital Alzahra Isfahan eine Studie durchgeführt~\cite{D8G7JHBA}. Dabei wurden die Schlafqualität mit der sogenannten Pittsburgh Sleep Quality Index (PSQI) Methode gemessen~\cite{HFB5QMRI}.\\ -Die Studie fand keinen signifikanten Einfluss zwischen der Schlafdauer und der Herzfrequenz, wenngleich sich gewisse Korrelationen zwischen der Schlafqualität den Heart rate variability (HRV) feststellen liessen. \ No newline at end of file +Die Studie fand keinen signifikanten Einfluss zwischen der Schlafdauer und der Herzfrequenz, wenngleich sich gewisse Korrelationen zwischen der Schlafqualität den Heart rate variability (HRV) feststellen liessen. +In anderen Studien wurde ein Zusammenhang zwischen Schlafmangel und Schlaganfällen festgestellt \cite{wolk_sleep_2005}. +Viele Faktoren wie Koffein, Sport und Stress beeinflussen zudem die Herzfrequenz und deren Variabilität \cite{valentini_variables_2009}. diff --git a/term-paper/results_fredy.tex b/term-paper/results_fredy.tex index 92ab019..7acec9b 100644 --- a/term-paper/results_fredy.tex +++ b/term-paper/results_fredy.tex @@ -2,3 +2,15 @@ %! Date = 24.10.24 % Preamble +\subsection{Frederic}\label{subsec:frederic} +Die Schlafqualität hat einen erheblichen Einfluss auf die Herzfrequenz.\\ +Die Schlafqualität scheint einen grösseren Einfluss auf die Herzfrequenz zu haben als die Schlafdauer.\\ +Weitere Einflussfaktoren, die aus dem Datensatz gelesen werden können, sind Stresslevel, Blutdruck, Alter oder Körperliche Aktivitäten. +\begin{figure}[H] + \centering + \subfloat{{\includegraphics[width=0.45\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/fredy/fredy_sleep_duration_hr} }}% + \qquad + \subfloat{{\includegraphics[width=0.45\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/fredy/fredy_sleep_quality_hr} }}% + \caption{Schlafqualität - HR vs. Schlafdauer - HR} + \label{fig:fredy-results} +\end{figure} \ No newline at end of file diff --git a/term-paper/results_gra.tex b/term-paper/results_gra.tex index 447a81c..7ab2b9b 100644 --- a/term-paper/results_gra.tex +++ b/term-paper/results_gra.tex @@ -2,20 +2,20 @@ %! Date = 24.10.24 % Preamble -\subsection{Michael Graber}\label{subsec:michael-graber} +\subsection{Michael}\label{subsec:michael-graber} Zwischen den Kalenderwochen K9 bis KW26 war die jeweilige durchschnittliche Schlafdauer niedriger.\\ In diesem Zeitraum befand sich meine Diplomarbeit auf ihrem Höhepunkt.\\ -Einen direkten Zusammenhang zwischen der Schlafdauer und der durchschnittlichen Herzfrequenz lässt sich in dieser Grafik nicht ausmachen: -\begin{figure}[H] - \centering - \includegraphics[width=1\linewidth]{../media/gra/gramic_weekly_hr_sleep} - \caption{Michael Graber - Durchschnittliche Schlafdauer und Herzfrequenzen} - \label{fig:gra-avg-sleep-duration-hr} -\end{figure} +%Einen direkten Zusammenhang zwischen der Schlafdauer und der durchschnittlichen Herzfrequenz lässt sich in dieser Grafik nicht ausmachen: +%\begin{figure}[H] +% \centering +% \includegraphics[width=0.75\linewidth]{../media/gra/gramic_weekly_hr_sleep} +% \caption{Michael Graber - Durchschnittliche Schlafdauer und Herzfrequenzen} +% \label{fig:gra-avg-sleep-duration-hr} +%\end{figure} Werden die Daten aber in Korrelation zueinander gesetzt, zeigt sich, dass je höher die durchschnittliche Schlafdauer ist, desto tiefer ist die durchschnittliche Herfrequenz: \begin{figure}[H] \centering - \includegraphics[width=1\linewidth]{../media/gra/gramic_sleep_hr_correlation} + \includegraphics[width=0.75\linewidth]{../media/gra/gramic_sleep_hr_correlation} \caption{Korrelation Schlafdauer und Herzfrequenz} \label{fig:gra-corr-sleep-duration-hr} \end{figure} \ No newline at end of file diff --git a/term-paper/title.tex b/term-paper/title.tex index 1af9650..c144d81 100644 --- a/term-paper/title.tex +++ b/term-paper/title.tex @@ -11,7 +11,8 @@ \affil[*]{E-Mail Adressen: frederic.kurbel@stud.fhgr.ch, oliver.schuetz@stud.fhgr.ch, michael.graber@stud.fhgr.ch} \date{\today} \maketitle - +\selectlanguage{english} \begin{abstract} Machen wir wirklich wirklich erst am Schluss -\end{abstract} \ No newline at end of file +\end{abstract} +\selectlanguage{ngerman} \ No newline at end of file