This commit is contained in:
git-sandro 2026-01-24 09:53:29 +01:00
parent 65f8d75d90
commit 4ff2e2798d
3 changed files with 5 additions and 1 deletions

Binary file not shown.

After

Width:  |  Height:  |  Size: 30 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 53 KiB

View File

@ -48,8 +48,12 @@
|Irrelevante Features|Welche Merkmale sind relevant fürs Modell| |Irrelevante Features|Welche Merkmale sind relevant fürs Modell|
|Data Snooping|Data Snooping ist eine Form der statistischen Verzerrung, bei der Daten oder Analysen manipuliert werden, um künstlich statistisch signifikante Ergebnisse zu erzielen.| |Data Snooping|Data Snooping ist eine Form der statistischen Verzerrung, bei der Daten oder Analysen manipuliert werden, um künstlich statistisch signifikante Ergebnisse zu erzielen.|
|Cross Validation|Cross Validation ist eine Technik, mit der überprüft wird, wie gut ein maschinelles Lernmodell bei unbekannten Daten funktioniert, während gleichzeitig Overfitting verhindert wird. Dabei wird wie folgt vorgegangen: Der Datensatz wird in mehrere Teile aufgeteilt. Das Modell wird an einigen Teilen trainiert und an den übrigen Teilen getestet. Dieser Resampling-Prozess wird mehrfach wiederholt, wobei jeweils unterschiedliche Teile des Datensatzes ausgewählt werden. Die Ergebnisse jedes Validierungsschritts werden gemittelt, um die endgültige Leistung zu ermitteln. ![Cross Validation](bilder/cross_validation.png)| |Cross Validation|Cross Validation ist eine Technik, mit der überprüft wird, wie gut ein maschinelles Lernmodell bei unbekannten Daten funktioniert, während gleichzeitig Overfitting verhindert wird. Dabei wird wie folgt vorgegangen: Der Datensatz wird in mehrere Teile aufgeteilt. Das Modell wird an einigen Teilen trainiert und an den übrigen Teilen getestet. Dieser Resampling-Prozess wird mehrfach wiederholt, wobei jeweils unterschiedliche Teile des Datensatzes ausgewählt werden. Die Ergebnisse jedes Validierungsschritts werden gemittelt, um die endgültige Leistung zu ermitteln. ![Cross Validation](bilder/cross_validation.png)|
## Explorative Datenanalyse ## Explorative Datenanalyse
|Begriff|Beschreibung|
|---|---|
|Explorative Datenanalyse|Explorative Datenanalyse (EDA) bezeichnet den Prozess, bei dem Daten untersucht, visualisiert und beschrieben werden, um erste Einsichten zu gewinnen, Zusammenhänge zu erkennen und Hypothesen zu formulieren — noch bevor Modellierung oder Hypothesentestsstattfinden.|
|Mittlere quadratische Abweichung (RMSE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)<sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>![RMSE](bilder/rmse.png)|
|Mittlerer absoluter Fehler (MAE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)<sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>![MAE](bilder/mae.png)|
## Lineare Regression ## Lineare Regression
## Klassifikation ## Klassifikation
## Unsupervised Learning Clustering ## Unsupervised Learning Clustering