36 lines
1.4 KiB
Python
36 lines
1.4 KiB
Python
import pandas as pd
|
|
|
|
# Lade die CSV-Dateien
|
|
# Datei 1 mit Semikolon (;) separiert (HR-Daten)
|
|
hr_data = pd.read_csv('/home/gra/PycharmProjects/cds_introduction_data_science_assignment/data/raw/hr_gramic.csv', sep=';')
|
|
|
|
# Datei 2 mit Komma (,) separiert (Schlafdaten)
|
|
sleep_data = pd.read_csv('/home/gra/PycharmProjects/cds_introduction_data_science_assignment/data/raw/sleep_gramic.csv', sep=',')
|
|
|
|
# Überprüfen der ersten Zeilen der Dateien
|
|
print("HR-Daten:")
|
|
print(hr_data.head())
|
|
|
|
print("\nSchlafdaten:")
|
|
print(sleep_data.head())
|
|
|
|
# Annahme: Beide Datensätze enthalten eine Spalte für Wochen (z.B. 'week')
|
|
# und die jeweiligen Werte (z.B. 'avg_hr' für Herzfrequenz und 'sleep_duration' für Schlafdauer)
|
|
|
|
# Sicherstellen, dass beide Datensätze nach Woche sortiert sind
|
|
hr_data = hr_data.sort_values(by='Datum')
|
|
sleep_data = sleep_data.sort_values(by='week')
|
|
|
|
# Kombinieren der beiden Datensätze anhand der 'week' Spalte
|
|
combined_data = pd.merge(hr_data, sleep_data, on='Datum')
|
|
|
|
# Überprüfen der kombinierten Daten
|
|
print("\nKombinierte Daten:")
|
|
print(combined_data.head())
|
|
|
|
# Berechne die Korrelation zwischen der durchschnittlichen Herzfrequenz (z.B. 'avg_hr')
|
|
# und der Schlafdauer (z.B. 'sleep_duration')
|
|
correlation = combined_data['avg_hr'].corr(combined_data['Durchschnittliche Dauer'])
|
|
|
|
print(f"\nDie Korrelation zwischen der Herzfrequenz und der Schlafdauer ist: {correlation}")
|