import pandas as pd # Lade die CSV-Dateien # Datei 1 mit Semikolon (;) separiert (HR-Daten) hr_data = pd.read_csv('/home/gra/PycharmProjects/cds_introduction_data_science_assignment/data/raw/hr_gramic.csv', sep=';') # Datei 2 mit Komma (,) separiert (Schlafdaten) sleep_data = pd.read_csv('/home/gra/PycharmProjects/cds_introduction_data_science_assignment/data/raw/sleep_gramic.csv', sep=',') # Überprüfen der ersten Zeilen der Dateien print("HR-Daten:") print(hr_data.head()) print("\nSchlafdaten:") print(sleep_data.head()) # Annahme: Beide Datensätze enthalten eine Spalte für Wochen (z.B. 'week') # und die jeweiligen Werte (z.B. 'avg_hr' für Herzfrequenz und 'sleep_duration' für Schlafdauer) # Sicherstellen, dass beide Datensätze nach Woche sortiert sind hr_data = hr_data.sort_values(by='Datum') sleep_data = sleep_data.sort_values(by='week') # Kombinieren der beiden Datensätze anhand der 'week' Spalte combined_data = pd.merge(hr_data, sleep_data, on='Datum') # Überprüfen der kombinierten Daten print("\nKombinierte Daten:") print(combined_data.head()) # Berechne die Korrelation zwischen der durchschnittlichen Herzfrequenz (z.B. 'avg_hr') # und der Schlafdauer (z.B. 'sleep_duration') correlation = combined_data['avg_hr'].corr(combined_data['Durchschnittliche Dauer']) print(f"\nDie Korrelation zwischen der Herzfrequenz und der Schlafdauer ist: {correlation}")