This commit is contained in:
git-sandro 2026-01-24 15:13:44 +01:00
parent 719a8207a7
commit fad71bd2a1

View File

@ -52,8 +52,8 @@
|Begriff|Beschreibung| |Begriff|Beschreibung|
|---|---| |---|---|
|Explorative Datenanalyse|Explorative Datenanalyse (EDA) bezeichnet den Prozess, bei dem Daten untersucht, visualisiert und beschrieben werden, um erste Einsichten zu gewinnen, Zusammenhänge zu erkennen und Hypothesen zu formulieren — noch bevor Modellierung oder Hypothesentestsstattfinden.| |Explorative Datenanalyse|Explorative Datenanalyse (EDA) bezeichnet den Prozess, bei dem Daten untersucht, visualisiert und beschrieben werden, um erste Einsichten zu gewinnen, Zusammenhänge zu erkennen und Hypothesen zu formulieren — noch bevor Modellierung oder Hypothesentestsstattfinden.|
|Mittlere quadratische Abweichung (RMSE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)<sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>![RMSE](bilder/rmse.png)| |Mittlere quadratische Abweichung (RMSE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)</sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>![RMSE](bilder/rmse.png)|
|Mittlerer absoluter Fehler (MAE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)<sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>![MAE](bilder/mae.png)| |Mittlerer absoluter Fehler (MAE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)</sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>![MAE](bilder/mae.png)|
|Stetige Merkmale|<ul><li>Belibigen Wert innerhalb eines Intervalls</li><li>Unendlich viele Ausprägungen</li><li>Beispiele<ul><li>Strekenlänge</li><li>Zeitintervalle</li><li>Gewicht</li></ul></li></ul>| |Stetige Merkmale|<ul><li>Belibigen Wert innerhalb eines Intervalls</li><li>Unendlich viele Ausprägungen</li><li>Beispiele<ul><li>Strekenlänge</li><li>Zeitintervalle</li><li>Gewicht</li></ul></li></ul>|
|Diskrete Merkmale|<ul><li>Endliche Anzahl Ausprägungen</li><li>Menge ist zählbar</li><li>Beispiele <ul><li>Schulnoten</li><li>Haarfarben</li><li>Geschlechter</li><li>Anzahl Teilnehmer eines Sportanlasses</li></ul></li></ul>| |Diskrete Merkmale|<ul><li>Endliche Anzahl Ausprägungen</li><li>Menge ist zählbar</li><li>Beispiele <ul><li>Schulnoten</li><li>Haarfarben</li><li>Geschlechter</li><li>Anzahl Teilnehmer eines Sportanlasses</li></ul></li></ul>|
|Skalenniveaus|![Skalenniveaus](bilder/skalenniveaus.png)| |Skalenniveaus|![Skalenniveaus](bilder/skalenniveaus.png)|
@ -162,7 +162,7 @@ $$
SSR = (2.2-4)^2+(3.1-4)^2+(4-4)^2+(4.9-4)^2+(5.8-4)^2 = 8.1 SSR = (2.2-4)^2+(3.1-4)^2+(4-4)^2+(4.9-4)^2+(5.8-4)^2 = 8.1
$$ $$
4. R<sup>2<sup> berechnen 4. R<sup>2</sup> berechnen
$$ $$
R^2 = \frac{SSR}{SST} R^2 = \frac{SSR}{SST}
$$ $$
@ -171,6 +171,7 @@ R^2 = \frac{8.1}{10} = 0.81
$$ $$
5. Interpretieren 5. Interpretieren
0.81 bedeutet, dass viele der Datenpunkte in der Nähe der Regressionsgerade sind
0.81 bedeutet, dass viele der Datenpunkte in der Nähe der Regressionsgerade sind.
## Klassifikation ## Klassifikation
## Unsupervised Learning Clustering ## Unsupervised Learning Clustering