Compare commits

..

12 Commits

Author SHA1 Message Date
TheOriginalGraLargeShrimpakaReaper 347a7150e6 final commit 2024-10-27 18:44:40 +01:00
TheOriginalGraLargeShrimpakaReaper 1891131318 Edits 2024-10-27 18:33:35 +01:00
TheOriginalGraLargeShrimpakaReaper 6881f62a34 Edits 2024-10-27 17:53:44 +01:00
TheOriginalGraLargeShrimpakaReaper a6465156b2 Edits 2024-10-27 16:53:56 +01:00
TheOriginalGraLargeShrimpakaReaper 423b421604 Edits 2024-10-27 16:47:56 +01:00
Oliver Schütz 4076c67792 Adding processed Data to folder 2024-10-27 16:11:51 +01:00
Oliver Schütz 9e7bc12733 Path fix 2024-10-27 13:57:29 +01:00
Oliver Schütz 13fb2b002e
Merge pull request #4 from TheOriginalGraLargeShrimpakaReaper/oliver-paper
oliver-paper
2024-10-27 01:10:51 +02:00
Oliver Schütz 07039d7264 Merge remote-tracking branch 'origin/oliver-paper' into oliver-paper
# Conflicts:
#	out/cds_introduction_data_science_assignment.pdf
#	term-paper/results_gra.tex
2024-10-27 01:08:50 +02:00
Oliver Schütz 8f7d6529f0 Analyse Paper Oliver und minor fixes 2024-10-27 01:08:04 +02:00
Oliver Schütz a14e09c534 Analyse Paper Oliver und minor fixes 2024-10-27 01:06:20 +02:00
Oliver Schütz 287701af20 Analyse Paper Oliver und minor fixes 2024-10-27 00:23:54 +02:00
22 changed files with 237 additions and 126 deletions

View File

@ -34,13 +34,12 @@ pip install setuptools
pip install bs4
pip install requests
```
## Hilfsmittel / Tools
## Tools
### Oliver
- Data Wrangler
- ChatGPT
- Grammatik
- https://chatgpt.com/share/671d541e-dfc0-8006-8df3-dcfcb0048214
- Github Copilot
- Code Completion: Boilerplate und Comments
- DeepL

View File

@ -0,0 +1,59 @@
,sleep_date,total_sleep_h,avg_sleep_hr,next_day,awake_date,avg_hr_day
0,2024-08-12,6.4,67,2024-08-13,2024-08-13,75.4962962962963
1,2024-08-13,8.17,69,2024-08-14,2024-08-14,75.43076923076923
2,2024-08-14,8.58,62,2024-08-15,2024-08-15,67.18333333333334
3,2024-08-15,7.53,60,2024-08-16,2024-08-16,74.8440366972477
4,2024-08-23,7.4,58,2024-08-24,2024-08-24,68.6
5,2024-08-25,10.73,64,2024-08-26,2024-08-26,76.3883495145631
6,2024-08-26,6.75,64,2024-08-27,2024-08-27,70.4862385321101
7,2024-08-27,7.62,58,2024-08-28,2024-08-28,73.91176470588235
8,2024-08-28,4.58,60,2024-08-29,2024-08-29,74.71544715447155
9,2024-08-29,6.63,60,2024-08-30,2024-08-30,84.85915492957747
10,2024-08-30,8.62,64,2024-08-31,2024-08-31,74.40196078431373
11,2024-08-31,7.73,68,2024-09-01,2024-09-01,70.78571428571429
12,2024-09-01,7.95,70,2024-09-02,2024-09-02,77.20430107526882
13,2024-09-02,9.03,65,2024-09-03,2024-09-03,73.64227642276423
14,2024-09-03,7.97,65,2024-09-04,2024-09-04,70.72357723577235
15,2024-09-04,8.1,64,2024-09-05,2024-09-05,67.07936507936508
16,2024-09-05,9.33,60,2024-09-06,2024-09-06,62.89041095890411
17,2024-09-06,8.63,59,2024-09-07,2024-09-07,66.96875
18,2024-09-07,7.92,60,2024-09-08,2024-09-08,69.33050847457628
19,2024-09-08,9.5,59,2024-09-09,2024-09-09,74.85454545454546
20,2024-09-09,8.7,64,2024-09-10,2024-09-10,72.11023622047244
21,2024-09-10,8.12,62,2024-09-11,2024-09-11,72.63963963963964
22,2024-09-11,7.98,64,2024-09-12,2024-09-12,75.96396396396396
23,2024-09-12,8.8,68,2024-09-13,2024-09-13,69.16964285714286
24,2024-09-13,7.45,66,2024-09-14,2024-09-14,66.52252252252252
25,2024-09-14,12.63,60,2024-09-15,2024-09-15,70.09649122807018
26,2024-09-15,10.3,65,2024-09-16,2024-09-16,71.2
27,2024-09-16,8.78,63,2024-09-17,2024-09-17,70.84210526315789
28,2024-09-17,10.08,66,2024-09-18,2024-09-18,71.97368421052632
29,2024-09-18,7.32,63,2024-09-19,2024-09-19,76.4962962962963
30,2024-09-19,7.33,64,2024-09-20,2024-09-20,74.49606299212599
31,2024-09-20,8.65,64,2024-09-21,2024-09-21,80.20353982300885
32,2024-09-21,8.3,63,2024-09-22,2024-09-22,81.92929292929293
33,2024-09-23,7.9,63,2024-09-24,2024-09-24,70.4201680672269
34,2024-09-24,6.87,67,2024-09-25,2024-09-25,78.40310077519379
35,2024-09-25,8.55,62,2024-09-26,2024-09-26,78.14503816793894
36,2024-09-26,6.63,65,2024-09-27,2024-09-27,74.25984251968504
37,2024-09-27,7.32,65,2024-09-28,2024-09-28,72.84677419354838
38,2024-09-28,6.78,66,2024-09-29,2024-09-29,74.43181818181819
39,2024-09-29,6.7,65,2024-09-30,2024-09-30,74.23214285714286
40,2024-09-30,8.97,64,2024-10-01,2024-10-01,73.95575221238938
41,2024-10-01,6.42,65,2024-10-02,2024-10-02,74.28455284552845
42,2024-10-02,6.6,64,2024-10-03,2024-10-03,75.91129032258064
43,2024-10-03,5.9,66,2024-10-04,2024-10-04,75.20353982300885
44,2024-10-04,6.48,71,2024-10-05,2024-10-05,73.05607476635514
45,2024-10-05,6.77,62,2024-10-06,2024-10-06,71.35036496350365
46,2024-10-06,7.33,65,2024-10-07,2024-10-07,100.58415841584159
47,2024-10-07,8.15,65,2024-10-08,2024-10-08,77.15322580645162
48,2024-10-08,9.5,68,2024-10-09,2024-10-09,73.5
49,2024-10-09,6.47,70,2024-10-10,2024-10-10,75.24193548387096
50,2024-10-10,8.18,69,2024-10-11,2024-10-11,76.74789915966386
51,2024-10-11,7.42,66,2024-10-12,2024-10-12,73.13084112149532
52,2024-10-12,8.12,64,2024-10-13,2024-10-13,72.72072072072072
53,2024-10-13,8.67,64,2024-10-14,2024-10-14,71.27835051546391
54,2024-10-14,8.65,65,2024-10-15,2024-10-15,67.93805309734513
55,2024-10-15,8.37,60,2024-10-16,2024-10-16,67.60975609756098
56,2024-10-16,7.73,61,2024-10-17,2024-10-17,74.04724409448819
57,2024-10-17,8.05,62,2024-10-18,2024-10-18,70.88172043010752
1 sleep_date total_sleep_h avg_sleep_hr next_day awake_date avg_hr_day
2 0 2024-08-12 6.4 67 2024-08-13 2024-08-13 75.4962962962963
3 1 2024-08-13 8.17 69 2024-08-14 2024-08-14 75.43076923076923
4 2 2024-08-14 8.58 62 2024-08-15 2024-08-15 67.18333333333334
5 3 2024-08-15 7.53 60 2024-08-16 2024-08-16 74.8440366972477
6 4 2024-08-23 7.4 58 2024-08-24 2024-08-24 68.6
7 5 2024-08-25 10.73 64 2024-08-26 2024-08-26 76.3883495145631
8 6 2024-08-26 6.75 64 2024-08-27 2024-08-27 70.4862385321101
9 7 2024-08-27 7.62 58 2024-08-28 2024-08-28 73.91176470588235
10 8 2024-08-28 4.58 60 2024-08-29 2024-08-29 74.71544715447155
11 9 2024-08-29 6.63 60 2024-08-30 2024-08-30 84.85915492957747
12 10 2024-08-30 8.62 64 2024-08-31 2024-08-31 74.40196078431373
13 11 2024-08-31 7.73 68 2024-09-01 2024-09-01 70.78571428571429
14 12 2024-09-01 7.95 70 2024-09-02 2024-09-02 77.20430107526882
15 13 2024-09-02 9.03 65 2024-09-03 2024-09-03 73.64227642276423
16 14 2024-09-03 7.97 65 2024-09-04 2024-09-04 70.72357723577235
17 15 2024-09-04 8.1 64 2024-09-05 2024-09-05 67.07936507936508
18 16 2024-09-05 9.33 60 2024-09-06 2024-09-06 62.89041095890411
19 17 2024-09-06 8.63 59 2024-09-07 2024-09-07 66.96875
20 18 2024-09-07 7.92 60 2024-09-08 2024-09-08 69.33050847457628
21 19 2024-09-08 9.5 59 2024-09-09 2024-09-09 74.85454545454546
22 20 2024-09-09 8.7 64 2024-09-10 2024-09-10 72.11023622047244
23 21 2024-09-10 8.12 62 2024-09-11 2024-09-11 72.63963963963964
24 22 2024-09-11 7.98 64 2024-09-12 2024-09-12 75.96396396396396
25 23 2024-09-12 8.8 68 2024-09-13 2024-09-13 69.16964285714286
26 24 2024-09-13 7.45 66 2024-09-14 2024-09-14 66.52252252252252
27 25 2024-09-14 12.63 60 2024-09-15 2024-09-15 70.09649122807018
28 26 2024-09-15 10.3 65 2024-09-16 2024-09-16 71.2
29 27 2024-09-16 8.78 63 2024-09-17 2024-09-17 70.84210526315789
30 28 2024-09-17 10.08 66 2024-09-18 2024-09-18 71.97368421052632
31 29 2024-09-18 7.32 63 2024-09-19 2024-09-19 76.4962962962963
32 30 2024-09-19 7.33 64 2024-09-20 2024-09-20 74.49606299212599
33 31 2024-09-20 8.65 64 2024-09-21 2024-09-21 80.20353982300885
34 32 2024-09-21 8.3 63 2024-09-22 2024-09-22 81.92929292929293
35 33 2024-09-23 7.9 63 2024-09-24 2024-09-24 70.4201680672269
36 34 2024-09-24 6.87 67 2024-09-25 2024-09-25 78.40310077519379
37 35 2024-09-25 8.55 62 2024-09-26 2024-09-26 78.14503816793894
38 36 2024-09-26 6.63 65 2024-09-27 2024-09-27 74.25984251968504
39 37 2024-09-27 7.32 65 2024-09-28 2024-09-28 72.84677419354838
40 38 2024-09-28 6.78 66 2024-09-29 2024-09-29 74.43181818181819
41 39 2024-09-29 6.7 65 2024-09-30 2024-09-30 74.23214285714286
42 40 2024-09-30 8.97 64 2024-10-01 2024-10-01 73.95575221238938
43 41 2024-10-01 6.42 65 2024-10-02 2024-10-02 74.28455284552845
44 42 2024-10-02 6.6 64 2024-10-03 2024-10-03 75.91129032258064
45 43 2024-10-03 5.9 66 2024-10-04 2024-10-04 75.20353982300885
46 44 2024-10-04 6.48 71 2024-10-05 2024-10-05 73.05607476635514
47 45 2024-10-05 6.77 62 2024-10-06 2024-10-06 71.35036496350365
48 46 2024-10-06 7.33 65 2024-10-07 2024-10-07 100.58415841584159
49 47 2024-10-07 8.15 65 2024-10-08 2024-10-08 77.15322580645162
50 48 2024-10-08 9.5 68 2024-10-09 2024-10-09 73.5
51 49 2024-10-09 6.47 70 2024-10-10 2024-10-10 75.24193548387096
52 50 2024-10-10 8.18 69 2024-10-11 2024-10-11 76.74789915966386
53 51 2024-10-11 7.42 66 2024-10-12 2024-10-12 73.13084112149532
54 52 2024-10-12 8.12 64 2024-10-13 2024-10-13 72.72072072072072
55 53 2024-10-13 8.67 64 2024-10-14 2024-10-14 71.27835051546391
56 54 2024-10-14 8.65 65 2024-10-15 2024-10-15 67.93805309734513
57 55 2024-10-15 8.37 60 2024-10-16 2024-10-16 67.60975609756098
58 56 2024-10-16 7.73 61 2024-10-17 2024-10-17 74.04724409448819
59 57 2024-10-17 8.05 62 2024-10-18 2024-10-18 70.88172043010752

Binary file not shown.

After

Width:  |  Height:  |  Size: 35 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 38 KiB

Binary file not shown.

Before

Width:  |  Height:  |  Size: 103 KiB

After

Width:  |  Height:  |  Size: 25 KiB

File diff suppressed because one or more lines are too long

View File

@ -1,8 +1,31 @@
@inbook{HFB5QMRI,
author = "Shahid, Azmeh and Wilkinson, Kate and Marcu, Shai and Shapiro, Colin M.",
title = "Pittsburgh Sleep Quality Index PSQI",
publisher = "Springer New York",
address = "New York, NY",
pages = "279-283",
year = "2011"
}
@misc{HEA4S3XH,
howpublished = "\url{https://www.med.upenn.edu/cbti/assets/user-content/documents/Pittsburgh\%20Sleep\%20Quality\%20Index\%20(PSQI).pdf}",
title = "PDF"
}
@misc{YEEWV3DH,
howpublished = "\url{https://www.tanaffosjournal.ir/article\_242146\_050977fd76f7a68418a04c8e6583c537.pdf}",
title = "Full Text PDF"
}
@article{D8G7JHBA,
author = "Sajjadieh, Amirreza and Shahsavari, Ali and Safae, Ali and Penzel, Thomas and Schoebel, Christoph and Fietze, Ingo and Mozafarian, Nafiseh and Amra, Babak and Kelishadi, Roya",
volume = "19",
url = "https://www.tanaffosjournal.ir/article\_242146.html",
title = "The Association of Sleep Duration and Quality with Heart Rate Variability and Blood Pressure",
pages = "135-143",
year = "2020"
}
@article{valentini_variables_2009,
series = {Heart {Rate} and {Cardiovascular} {Disease}},
title = {Variables {Influencing} {Heart} {Rate}},
@ -21,15 +44,6 @@
pages = {11--19},
}
@article{D8G7JHBA,
author = "Sajjadieh, Amirreza and Shahsavari, Ali and Safae, Ali and Penzel, Thomas and Schoebel, Christoph and Fietze, Ingo and Mozafarian, Nafiseh and Amra, Babak and Kelishadi, Roya",
volume = "19",
url = "https://www.tanaffosjournal.ir/article\_242146.html",
title = "The Association of Sleep Duration and Quality with Heart Rate Variability and Blood Pressure",
pages = "135-143",
year = "2020"
}
@article{wolk_sleep_2005,
title = {Sleep and {Cardiovascular} {Disease}},
volume = {30},

View File

@ -24,16 +24,16 @@
\input{title}
%\begin{multicols}{2}
\section{Einleitung}
%\input{introduction}
%\citeauthor{Student2022} führt aus Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua \cite{Student2022}.
\section{Forschungsfragen und Methodik}
\input{research_question}
%\section{Forschungsfrage}\label{sec:forschungsfrage}
%\input{research_question}
\section{Daten}\label{sec:daten}
\input{data_fredy}
\input{data_oli}
\input{data_gra}
\input{relevance}
\section{Resultate}
\section{Resultate}\label{sec:resultate}
\input{results_fredy}
\input{results_oli}
\input{results_gra}
@ -55,8 +55,9 @@
%\end{figure}
%Lorem ipsum dolor sit amet figure \ref{fig:ipsum}.
\section{Diskussion}
\input{discussion_fredy}
\section{Diskussion}\label{sec:diskussion}
%\input{discussion_fredy}
\input{discussion_group}
\input{discussion_oli}
\input{discussion_gra}
%\end{multicols}

View File

@ -2,3 +2,6 @@
%! Date = 24.10.24
% Preamble
\subsection{Daten Frederic}\label{subsec:datenbeschaffung-frederic}
Dieser Datensatz basiert auf dem Sleep Health and Lifestyle Dataset auf \href{https://www.kaggle.com/datasets/uom190346a/sleep-health-and-lifestyle-dataset?resource=download}{\textit{"Sleep Health and Lifestyle Dataset"}}.
Zu den Details gehören unter anderem das Geschlecht, Alter, Beruf, Schlafdauer, Schlafqualität, körperliche Aktivität, Stresslevel, BMI-Kategorie, Blutdruck, Herzfrequenz, tägliche Schritte und das Vorliegen von Schlafstörungen.

View File

@ -2,58 +2,59 @@
%! Date = 24.10.24
% Preamble
\subsection{Datenbeschaffung Michael Graber}
\subsubsection{Datenquelle}
Quelle waren Daten aus dem Garmin Connect Portal.\\
Die Daten selber stammen zu einem kleinen Teil von einer Garmin f\=enix 3 Saphir HR, einer Garmin Instinct Solar 2 und einer Garmin Instinct Solar 2X.\\
\subsection{Daten Michael}\label{subsec:datenbeschaffung-michael-graber}
\subsubsection{Datenquelle / Datenbeschaffung}
%Quelle waren Daten aus dem Garmin Connect Portal.\\
%zu einem kleinen Teil %
Datenquelle war Garmin Connect, die Daten selber stammen von einer Garmin f\=enix 3 Saphir HR sowie einer Garmin Instinct Solar 2/ 2X.\\% und einer Garmin Instinct Solar 2X.
Da die Garmin f\=enix 3 Saphir noch keine REM-Daten zur verfügung stellte, konnte nur die Schlafdauer betrachtet werden.\\
Eine Mischung aus den f\=enix 3 Saphir HR Schlafdaten mit Wach-, Leicht- und Tiefschlafphasen und den Instinct Solar 2 / 2X Schlafdaten mit REM-, Wach-, Leicht- und Tiefschlafphasen würde zu einem verfälschten Resultat führen.\\\\
Zwischen der f\=enix 3 Saphir HR und der Instinct Solar 2 / 2X liegt zudem ein Altersunterschied von mehr als sieben Jahren.
Da alle drei Sportuhren keine Medizinalprodukte sind und daher keiner genormten Eichung unterliegen, besteht eine gewisse Vergleichsunschärfe.
Mit der Konzentatrion auf die Schlafdauer beschränkt sich diese Unschärfe nur auf die HR-Daten.
Für HR-Daten stellt Garmin keinen csv-Export zur Verfügung.\\
Entsprechend musste die Daten manuell aus dem Web GUI von Garmin Connect kopiert werden.\\\\
Garmin Connect bietet nur Schlaf- und HR-Daten, die als Wochendurchschnitt gespeichert sind.\\
Um Daten pro Tag zu erhalten, müsste auf eine kostenpflichtige API zurückgegriffen werden.
%Eine Mischung aus den f\=enix 3 Saphir HR Schlafdaten mit Wach-, Leicht- und Tiefschlafphasen und den Instinct Solar 2 / 2X Schlafdaten mit REM-, Wach-, Leicht- und Tiefschlafphasen würde zu einem verfälschten Resultat führen.\\\\
%Zwischen der f\=enix 3 Saphir HR und der Instinct Solar 2 / 2X liegt zudem ein Altersunterschied von mehr als sieben Jahren.
%Da alle drei Sportuhren keine Medizinalprodukte sind und daher keiner genormten Eichung unterliegen, besteht eine gewisse Vergleichsunschärfe.
%Mit der Konzentatrion auf die Schlafdauer beschränkt sich diese Unschärfe nur auf die HR-Daten.
Für HR-Daten stellt Garmin keinen csv-Export zur Verfügung, entsprechend musste die Daten manuell aus dem Web GUI von Garmin Connect kopiert werden.\\
Garmin Connect bietet nur Schlaf- und HR-Daten, die als Wochendurchschnitt gespeichert sind.
%Um Daten pro Tag zu erhalten, müsste auf eine kostenpflichtige API zurückgegriffen werden.
\subsubsection{Datenqualität}
Die Daten der Wochen der Schlaf- und HR-Daten korrelieren nicht miteinander.\\
Hinzu kommt, dass Garmin Daten aus dem Vorjahr mit dem Jahr angibt, die aus dem aktuellen nicht:
\begin{figure}[H]
\centering
\subfloat{{\includegraphics[width=0.43\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_hr_data_dates} }}%
\qquad
\subfloat{{\includegraphics[width=0.4\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_dates} }}%
\caption{ Datumsaufbau HR- und Schlafdaten}
\label{fig:gra-date_differences}
\end{figure}
Hinzu kommt, dass das csv mit den Schlafdaten die Spalten mit einem Komma separierte,
das Jahr 2023 wird ebenfalls mit einem Komma getrennt.\\
Als resultat haben alle Datensätze ab 2023 eine weitere Spalte.
\begin{figure}[H]
\centering
\includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_data_encoding}
\caption{Michael Graber - csv Kodierung}
\label{fig:gra-sleep-data-csv-encoding}
\end{figure}
%Hinzu kommt, dass Garmin Daten aus dem Vorjahr mit dem Jahr angibt, die aus dem aktuellen nicht.%:
%\begin{figure}[H]
% \centering
% \subfloat{{\includegraphics[width=0.43\linewidth]{../media/gra/gramic_hr_data_dates} }}%
% \qquad
% \subfloat{{\includegraphics[width=0.4\linewidth]{../media/gra/gramic_sleep_data_dates} }}%
% \caption{ Datumsaufbau HR- und Schlafdaten}
% \label{fig:gra-date_differences}
%\end{figure}
Des Weiteren ist das csv mit den Schlafdaten Kommasepariert,
das Jahr 2023 wird ebenfalls mit einem Komma getrennt.
Als Resultat haben alle Datensätze ab 2023 eine weitere Spalte.
%\begin{figure}[H]
% \centering
% \includegraphics[width=0.4\linewidth]{../media/gra/gramic_sleep_data_data_encoding}
% \caption{Michael Graber - csv Kodierung}
% \label{fig:gra-sleep-data-csv-encoding}
%\end{figure}
\subsubsection{Datenbereinigung}
Mit einem Python Skript wurden die Daten bereinigt.\\
Dazu wurde anhand des Datumsbereichs und dem Jahr (dort wo kein Jahr angegeben wurde, galt das aktuelle Jahr die Kalenderwoche ermittelt.\\
So können beide Datensätze miteinander kombiniert werden.\\\\
Der nächste Schritt bestand darin, bei den HR-Daten dass \guillemotleft bpm\guillemotright zu entfernen, um die Werte Dezimalzahl umzuwandeln.\\\\
In einem nächsten Schritt müssen die Ruhe- und Aktivdaten zu einem Durchschnitt gerechnet werden.\\\\
Die so bereinigten Daten werden als csv-Datei zwischengespeichert:
\begin{figure}[H]
\centering
\subfloat{{\includegraphics[width=0.3\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_hr_data_cleaned} }}%
\qquad
\subfloat{{\includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_data_cleaned} }}%
\caption{ Bereinigte HR- und Schlafdaten}
\label{fig:gra-cleaned-datas}
\end{figure}
In einem letzten Schritt wurden die beiden Datensätze kombiniert und ebenfalls als csv-Datei zwischengespeichert:
\begin{figure}[H]
\centering
\includegraphics[width=0.5\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_combined_data}
\caption{Michael Graber - Kombinierte Daten als csv}
\label{fig:gra-combined-data}
\end{figure}
%Mit einem Python Skript wurden die Daten bereinigt.
%Dazu wurde anhand des Datumsbereichs und dem Jahr (dort wo kein Jahr angegeben wurde, galt das aktuelle Jahr) die Kalenderwoche ermittelt.
%So können beide Datensätze miteinander kombiniert werden.\\
%Der nächste Schritt bestand darin, bei den HR-Daten, dass \guillemotleft bpm\guillemotright zu entfernen, um die Werte Dezimalzahl umzuwandeln.
%In einem nächsten Schritt müssen die Ruhe- und Aktivdaten zu einem Durchschnitt gerechnet werden.
%Die so bereinigten Daten werden als csv-Datei zwischengespeichert.%:
%\begin{figure}[H]
% \centering
% \subfloat{{\includegraphics[width=0.3\linewidth]{../media/gra/gramic_hr_data_cleaned} }}%
% \qquad
% \subfloat{{\includegraphics[width=0.5\linewidth]{../media/gra/gramic_sleep_data_cleaned} }}%
% \caption{ Bereinigte HR- und Schlafdaten}
% \label{fig:gra-cleaned-datas}
%\end{figure}
%In einem letzten Schritt wurden die beiden Datensätze kombiniert.% und ebenfalls als csv-Datei zwischengespeichert.%:
%\begin{figure}[H]
% \centering
% \includegraphics[width=0.4\linewidth]{../media/gra/gramic_combined_data}
% \caption{Michael Graber - Kombinierte Daten als csv}
% \label{fig:gra-combined-data}
%\end{figure}
Die Datenbereiche wurden umgewandelt, die Einheiten aus den Werten entfernt, die HR-Durchschnittswerte berechnet werden und die Daten zuletzt kombiniert.

View File

@ -3,23 +3,10 @@
% Preamble
\subsection{Daten Oliver}
\subsubsection{Beschaffung}
Zur Aufzeichnung meiner Daten habe ich eine "Withings Steel HR Sport"-Uhr verwendet. Damit habe ich von August bis Oktober Schlafdaten und den Tagespuls erfasst. Diese Daten werden in der App visualisiert und sind dort zugänglich. Für den Schlaf erhält man einen Sleep Score, die verschiedenen Schlafphasen, den Puls während des Schlafs, die Dauer, den Start- und Endzeitpunkt sowie Unterbrechungen.
Für den Tagespuls sieht man für jeden Tag eine Kurve mit dem Verlauf, dem Minimum, Maximum und Durchschnitt. Um die Daten in einem verarbeitbaren Format zu erhalten, habe ich in der App eine E-Mail-Anfrage gestellt, um meine Daten herunterzuladen. Diese wurden mir als ZIP-Datei per E-Mail zugeschickt. Die ZIP-Datei enthält mehrere CSV-Dateien mit verschiedenen Daten, von denen die meisten Metadaten oder leere Tabellen sind. Die beiden Tabellen, die für meine Analyse relevant sind, enthalten die zuvor genannten Spalten.
\subsubsection{Aufbereitung}
Zunächst werden beide Tabellen in ein Pandas DataFrame eingelesen.
Beginnend mit den Schlafdaten:
Da der Zeitpunkt des Schlafs in keinem geeigneten Format vorlag, wurde der Endzeitpunkt als Datum des Schlafs verwendet. Die Dauer wurde aus der Summe aller Schlafphasen berechnet und von Sekunden in Stunden umgerechnet. Da der Einfluss auf den nächsten Tag untersucht werden soll, wurde das Folgedatum dem Tagespuls zugeordnet.
Für den Tagespuls:
Die Werte für den Puls lagen nicht im Integer-Format vor, sondern als String mit einem Array. Dieses Array musste in einzelne Zahlenwerte aufgespalten werden, wobei für jedes Element des Arrays eine neue Zeile erzeugt wurde. Danach wurden alle Werte nach Datum gruppiert und daraus der Durchschnitt pro Tag berechnet.
Abschließend wurden beide Tabellen anhand des Datums zusammengeführt und fehlerhafte Werte aus dem Datensatz entfernt.
\subsection{Daten Oliver}\label{subsec:daten-oliver}
\subsubsection{Beschaffung} Die Datenaufzeichnung erfolgte mit der \texttt{'Withings Steel HR Sport'} Uhr, die Schlafdaten und die Herzfrequenz am Tag im Zeitraum von August bis Oktober erfasste.
Der Export der Daten wurde über die App durchgeführt, indem eine Datenanfrage gestellt wurde; die Daten kamen per E-Mail als ZIP-Datei mit mehreren CSV-Dateien an.
\subsubsection{Aufbereitung} Die Werte wurden in kompatible Datentypen umgewandelt und mehrere Tages- und Schlafaufzeichnungen zu einem einheitlichen Datensatz zusammengefasst. Anschließend wurden beide Tabellen anhand des Datums zusammengeführt, und fehlerhafte Werte aus dem Datensatz entfernt.

View File

@ -2,3 +2,4 @@
%! Date = 24.10.24
% Preamble
\subsection{Frederic}\label{subsec:frederic2}

View File

@ -2,7 +2,7 @@
%! Date = 24.10.24
% Preamble
\subsection{Michael Graber}
Die Qualität der Datenqualität könnte gesteigert werden, indem die Daten Tageweise gespeichert und verglichen würden.\\
\subsection{Michael}\label{subsec:michael-graber2}
Die Qualität der Daten könnte gesteigert werden, indem die Daten Tageweise gespeichert und verglichen würden.\\
Dazu müsste nicht zwangsweise auf die kostenpflichtige API zurückgegriffen werden,\\
mithilfe eines Webcrawlers kännten die Daten pro Tag ausgelesen werden.

View File

@ -0,0 +1,9 @@
%! Author = gra
%! Date = 27.10.24
% Preamble
\subsection{Gruppe}\label{subsec:gruppe}
Ähnlich zu den Forschungspapern zeigt sich, dass die Schlafdauer selber nur eine geringe Auswirkung auf die Herzfrequenz hat.\\
Die Schlafqualität hingegen scheint einen höheren Einfluss zu haben.\\\\
Es fehlen aber geeichte und standardisierte Datensätze, sie liessen sich so schlecht miteinander verbinden und vergleichen.\\
Für eine Teamarbeit mit geteilten Datensätzen wären Information zu Methoden, Toleranzen, Unschärfen und andere Parameter notwendig gewesen.

View File

@ -2,11 +2,7 @@
%! Date = 24.10.24
% Preamble
\subsection{Oliver}
Trotz leichter Korrelation gibt es bei diesem Vorgehen viele Fehlerquellen. Die Datenmenge war recht klein, und da meine Schlafzeiten relativ konsistent waren und ich durchschnittlich einen sehr hohen Sleep Score (circa 90) hatte, fehlt größtenteils das untere Spektrum.
\subsection{Oliver}\label{subsec:oliver}
Trotz leichter Korrelation gibt es bei diesem Vorgehen viele Fehlerquellen.
Die Datenmenge war recht klein, und da meine Schlafzeiten relativ konsistent waren und ich durchschnittlich einen sehr hohen Sleep Score (circa 90) hatte, fehlt größtenteils das untere Spektrum.
Zudem beziehen sich die Daten nur auf eine Person, sodass es möglich ist, dass der Einfluss des Schlafs bei mir stärker ausgeprägt ist als bei anderen.
Der Einfluss des Schlafs auf die Gesundheit ist bereits umfassend erforscht, und es wurde ein Zusammenhang zwischen Schlafmangel und Schlaganfällen festgestellt \cite{wolk_sleep_2005}. Dies bestätigt die Annahme, dass die Schlafqualität langfristig einen Einfluss auf den Puls haben kann.
Es ist jedoch schwierig, den Puls des nächsten Tages genau vorherzusagen, da dieser auch durch andere Faktoren wie Koffein, Sport, Stress etc. beeinflusst werden kann \cite{valentini_variables_2009}.

View File

@ -0,0 +1,6 @@
%! Author = gra
%! Date = 27.10.24
% Preamble
\section{Einleitung}\label{sec: einleitung}
Im Rahmen des Kurses Einführung in Computational und Data Science erhielten wir den Auftrag, eine Forschungsfrage zu erarbeiten und anhand eigener Fitnessdaten (oder einem Beispieldatensatz), Korrelatione zu ermitteln und Visualisieren.

View File

@ -2,5 +2,9 @@
%! Date = 24.10.24
% Preamble
\section{Stand der Forschung}
\citeauthor{D8G7JHBA}
\section{Stand der Forschung}\label{sec: stand-der-forschung}
Im Jahr 2011 wurde an der Universität Isfahan und am Spital Alzahra Isfahan eine Studie durchgeführt~\cite{D8G7JHBA}.
Dabei wurden die Schlafqualität mit der sogenannten Pittsburgh Sleep Quality Index (PSQI) Methode gemessen~\cite{HFB5QMRI}.\\
Die Studie fand keinen signifikanten Einfluss zwischen der Schlafdauer und der Herzfrequenz, wenngleich sich gewisse Korrelationen zwischen der Schlafqualität den Heart rate variability (HRV) feststellen liessen.
In anderen Studien wurde ein Zusammenhang zwischen Schlafmangel und Schlaganfällen festgestellt \cite{wolk_sleep_2005}.
Viele Faktoren wie Koffein, Sport und Stress beeinflussen zudem die Herzfrequenz und deren Variabilität \cite{valentini_variables_2009}.

View File

@ -2,3 +2,7 @@
%! Date = 24.10.24
% Preamble
\subsection{Forschungsfrage}\label{subsec:forschungsfrage}
Die grundsätzliche Forschungsfrage lautet, wie beeinflusst der Schlaf die Herzfrequenz. \\
Spezifisch die durchschnittliche Herzfrequanz am nächsten Tag? \\
Eine erweiterte Forschungsfrage würde wie folgt lauten: Welche negativen oder unerwünschten Informationen lassen sich aus den Metadaten von Fitnessdaten über eine Person gewinnen?

View File

@ -2,3 +2,15 @@
%! Date = 24.10.24
% Preamble
\subsection{Frederic}\label{subsec:frederic}
Die Schlafqualität hat einen erheblichen Einfluss auf die Herzfrequenz.\\
Die Schlafqualität scheint einen grösseren Einfluss auf die Herzfrequenz zu haben als die Schlafdauer.\\
Weitere Einflussfaktoren, die aus dem Datensatz gelesen werden können, sind Stresslevel, Blutdruck, Alter oder Körperliche Aktivitäten.
\begin{figure}[H]
\centering
\subfloat{{\includegraphics[width=0.45\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/fredy/fredy_sleep_duration_hr} }}%
\qquad
\subfloat{{\includegraphics[width=0.45\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/fredy/fredy_sleep_quality_hr} }}%
\caption{Schlafqualität - HR vs. Schlafdauer - HR}
\label{fig:fredy-results}
\end{figure}

View File

@ -2,20 +2,20 @@
%! Date = 24.10.24
% Preamble
\subsection{Michael Graber}
\subsection{Michael}\label{subsec:michael-graber}
Zwischen den Kalenderwochen K9 bis KW26 war die jeweilige durchschnittliche Schlafdauer niedriger.\\
In diesem Zeitraum befand sich meine Diplomarbeit auf ihrem Höhepunkt.\\
Einen direkten Zusammenhang zwischen der Schlafdauer und der durchschnittlichen Herzfrequenz lässt sich in dieser Grafik nicht ausmachen:
\begin{figure}[H]
\centering
\includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_weekly_hr_sleep}
\caption{Michael Graber - Durchschnittliche Schlafdauer und Herzfrequenzen}
\label{fig:gra-avg-sleep-duration-hr}
\end{figure}
%Einen direkten Zusammenhang zwischen der Schlafdauer und der durchschnittlichen Herzfrequenz lässt sich in dieser Grafik nicht ausmachen:
%\begin{figure}[H]
% \centering
% \includegraphics[width=0.75\linewidth]{../media/gra/gramic_weekly_hr_sleep}
% \caption{Michael Graber - Durchschnittliche Schlafdauer und Herzfrequenzen}
% \label{fig:gra-avg-sleep-duration-hr}
%\end{figure}
Werden die Daten aber in Korrelation zueinander gesetzt, zeigt sich, dass je höher die durchschnittliche Schlafdauer ist, desto tiefer ist die durchschnittliche Herfrequenz:
\begin{figure}[H]
\centering
\includegraphics[width=1\linewidth]{/home/gra/PycharmProjects/cds_introduction_data_science_assignment/media/gra/gramic_sleep_hr_correlation}
\includegraphics[width=0.75\linewidth]{../media/gra/gramic_sleep_hr_correlation}
\caption{Korrelation Schlafdauer und Herzfrequenz}
\label{fig:gra-corr-sleep-duration-hr}
\end{figure}

View File

@ -11,7 +11,11 @@
\affil[*]{E-Mail Adressen: frederic.kurbel@stud.fhgr.ch, oliver.schuetz@stud.fhgr.ch, michael.graber@stud.fhgr.ch}
\date{\today}
\maketitle
\selectlanguage{english}
\begin{abstract}
Machen wir wirklich wirklich erst am Schluss
\end{abstract}
Diese Arbeit untersucht den Einfluss der Schlafqualität auf die Herzfrequenz anhand von Daten aus persönlichen Fitness-Trackern und einem öffentlich verfügbaren Datensatz.\\
Ähnlich zu anderen Papers zeigte sich, dass die Schlafdauer wenig Einfluss auf die Herzfrequenz hat, die Schlafqualität wiederum hat einen signifikanteren Einfluss.\\
Da die Daten aus verschiedenen Sportuhren und Herstellern stammen, war es nicht möglich, die Daten in der kurzen Zeit zu kombinieren.
Zu guter Letzt hätte die Datenqualität erhöht werden können, wenn die Garmin Daten Datenweise gewonnen worden wären.
\end{abstract}
\selectlanguage{ngerman}