z update
This commit is contained in:
parent
65f8d75d90
commit
4ff2e2798d
BIN
zusammenfassung/bilder/mae.png
Normal file
BIN
zusammenfassung/bilder/mae.png
Normal file
Binary file not shown.
|
After Width: | Height: | Size: 30 KiB |
BIN
zusammenfassung/bilder/rmse.png
Normal file
BIN
zusammenfassung/bilder/rmse.png
Normal file
Binary file not shown.
|
After Width: | Height: | Size: 53 KiB |
@ -48,8 +48,12 @@
|
|||||||
|Irrelevante Features|Welche Merkmale sind relevant fürs Modell|
|
|Irrelevante Features|Welche Merkmale sind relevant fürs Modell|
|
||||||
|Data Snooping|Data Snooping ist eine Form der statistischen Verzerrung, bei der Daten oder Analysen manipuliert werden, um künstlich statistisch signifikante Ergebnisse zu erzielen.|
|
|Data Snooping|Data Snooping ist eine Form der statistischen Verzerrung, bei der Daten oder Analysen manipuliert werden, um künstlich statistisch signifikante Ergebnisse zu erzielen.|
|
||||||
|Cross Validation|Cross Validation ist eine Technik, mit der überprüft wird, wie gut ein maschinelles Lernmodell bei unbekannten Daten funktioniert, während gleichzeitig Overfitting verhindert wird. Dabei wird wie folgt vorgegangen: Der Datensatz wird in mehrere Teile aufgeteilt. Das Modell wird an einigen Teilen trainiert und an den übrigen Teilen getestet. Dieser Resampling-Prozess wird mehrfach wiederholt, wobei jeweils unterschiedliche Teile des Datensatzes ausgewählt werden. Die Ergebnisse jedes Validierungsschritts werden gemittelt, um die endgültige Leistung zu ermitteln. |
|
|Cross Validation|Cross Validation ist eine Technik, mit der überprüft wird, wie gut ein maschinelles Lernmodell bei unbekannten Daten funktioniert, während gleichzeitig Overfitting verhindert wird. Dabei wird wie folgt vorgegangen: Der Datensatz wird in mehrere Teile aufgeteilt. Das Modell wird an einigen Teilen trainiert und an den übrigen Teilen getestet. Dieser Resampling-Prozess wird mehrfach wiederholt, wobei jeweils unterschiedliche Teile des Datensatzes ausgewählt werden. Die Ergebnisse jedes Validierungsschritts werden gemittelt, um die endgültige Leistung zu ermitteln. |
|
||||||
|
|
||||||
## Explorative Datenanalyse
|
## Explorative Datenanalyse
|
||||||
|
|Begriff|Beschreibung|
|
||||||
|
|---|---|
|
||||||
|
|Explorative Datenanalyse|Explorative Datenanalyse (EDA) bezeichnet den Prozess, bei dem Daten untersucht, visualisiert und beschrieben werden, um erste Einsichten zu gewinnen, Zusammenhänge zu erkennen und Hypothesen zu formulieren — noch bevor Modellierung oder Hypothesentestsstattfinden.|
|
||||||
|
|Mittlere quadratische Abweichung (RMSE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)<sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>|
|
||||||
|
|Mittlerer absoluter Fehler (MAE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)<sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>|
|
||||||
## Lineare Regression
|
## Lineare Regression
|
||||||
## Klassifikation
|
## Klassifikation
|
||||||
## Unsupervised Learning Clustering
|
## Unsupervised Learning Clustering
|
||||||
Loading…
x
Reference in New Issue
Block a user