diff --git a/zusammenfassung/bilder/mae.png b/zusammenfassung/bilder/mae.png new file mode 100644 index 0000000..5147c12 Binary files /dev/null and b/zusammenfassung/bilder/mae.png differ diff --git a/zusammenfassung/bilder/rmse.png b/zusammenfassung/bilder/rmse.png new file mode 100644 index 0000000..dde5ce5 Binary files /dev/null and b/zusammenfassung/bilder/rmse.png differ diff --git a/zusammenfassung/zusammenfassung.md b/zusammenfassung/zusammenfassung.md index 54185f6..ecc3c9e 100644 --- a/zusammenfassung/zusammenfassung.md +++ b/zusammenfassung/zusammenfassung.md @@ -48,8 +48,12 @@ |Irrelevante Features|Welche Merkmale sind relevant fürs Modell| |Data Snooping|Data Snooping ist eine Form der statistischen Verzerrung, bei der Daten oder Analysen manipuliert werden, um künstlich statistisch signifikante Ergebnisse zu erzielen.| |Cross Validation|Cross Validation ist eine Technik, mit der überprüft wird, wie gut ein maschinelles Lernmodell bei unbekannten Daten funktioniert, während gleichzeitig Overfitting verhindert wird. Dabei wird wie folgt vorgegangen: Der Datensatz wird in mehrere Teile aufgeteilt. Das Modell wird an einigen Teilen trainiert und an den übrigen Teilen getestet. Dieser Resampling-Prozess wird mehrfach wiederholt, wobei jeweils unterschiedliche Teile des Datensatzes ausgewählt werden. Die Ergebnisse jedes Validierungsschritts werden gemittelt, um die endgültige Leistung zu ermitteln. | - ## Explorative Datenanalyse +|Begriff|Beschreibung| +|---|---| +|Explorative Datenanalyse|Explorative Datenanalyse (EDA) bezeichnet den Prozess, bei dem Daten untersucht, visualisiert und beschrieben werden, um erste Einsichten zu gewinnen, Zusammenhänge zu erkennen und Hypothesen zu formulieren — noch bevor Modellierung oder Hypothesentestsstattfinden.| +|Mittlere quadratische Abweichung (RMSE)|