Zur Aufzeichnung meiner Daten habe ich eine \texttt{'Withings Steel HR Sport'} Uhr verwendet. Damit habe ich von August bis Oktober Schlafdaten und den Tagespuls erfasst. Diese Daten werden in der App visualisiert und sind dort zugänglich. Für den Schlaf erhält man einen Sleep Score, die verschiedenen Schlafphasen, den Puls während des Schlafs, die Dauer, den Start- und Endzeitpunkt sowie Unterbrechungen.
Für den Tagespuls sieht man für jeden Tag eine Kurve mit dem Verlauf, dem Minimum, Maximum und Durchschnitt. Um die Daten in einem verarbeitbaren Format zu erhalten, habe ich in der App eine E-Mail-Anfrage gestellt, um meine Daten herunterzuladen. Diese wurden mir als ZIP-Datei per E-Mail zugeschickt. Die ZIP-Datei enthält mehrere CSV-Dateien mit verschiedenen Daten, von denen die meisten Metadaten oder leere Tabellen sind. Die beiden Tabellen, die für meine Analyse relevant sind, enthalten die zuvor genannten Spalten.
\subsubsection{Aufbereitung}
Zunächst werden beide Tabellen in ein Pandas DataFrame eingelesen.
Beginnend mit den Schlafdaten:
Da der Zeitpunkt des Schlafs in keinem geeigneten Format vorlag, wurde der Endzeitpunkt als Datum des Schlafs verwendet. Die Dauer wurde aus der Summe aller Schlafphasen berechnet und von Sekunden in Stunden umgerechnet. Da der Einfluss auf den nächsten Tag untersucht werden soll, wurde das Folgedatum dem Tagespuls zugeordnet.
Für den Tagespuls:
Die Werte für den Puls lagen nicht im Integer-Format vor, sondern als String mit einem Array. Dieses Array musste in einzelne Zahlenwerte aufgespalten werden, wobei für jedes Element des Arrays eine neue Zeile erzeugt wurde. Danach wurden alle Werte nach Datum gruppiert und daraus der Durchschnitt pro Tag berechnet.
Abschließend wurden beide Tabellen anhand des Datums zusammengeführt und fehlerhafte Werte aus dem Datensatz entfernt.