klassifikation
This commit is contained in:
parent
4154036441
commit
f9e3387e81
BIN
zusammenfassung/bilder/logistische_regression.png
Normal file
BIN
zusammenfassung/bilder/logistische_regression.png
Normal file
Binary file not shown.
|
After Width: | Height: | Size: 85 KiB |
@ -52,8 +52,8 @@
|
||||
|Begriff|Beschreibung|
|
||||
|---|---|
|
||||
|Explorative Datenanalyse|Explorative Datenanalyse (EDA) bezeichnet den Prozess, bei dem Daten untersucht, visualisiert und beschrieben werden, um erste Einsichten zu gewinnen, Zusammenhänge zu erkennen und Hypothesen zu formulieren — noch bevor Modellierung oder Hypothesentestsstattfinden.|
|
||||
|Mittlere quadratische Abweichung (RMSE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)</sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul> Die mittlere quadratische Abweichung misst den durchschnittlichen quadratischen Unterschied zwischen vorhergesagten und tatsächlichen Werten und bestraft größere Abweichungen stärker.|
|
||||
|Mittlerer absoluter Fehler (MAE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)</sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul> Der mittlere absolute Fehler gibt an, wie groß die durchschnittliche absolute Differenz zwischen Vorhersagen und tatsächlichen Werten ist, ohne größere Abweichungen zusätzlich zu gewichten.|
|
||||
|Mittlere quadratische Abweichung (RMSE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)</sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul> Die mittlere quadratische Abweichung misst den durchschnittlichen quadratischen Unterschied zwischen vorhergesagten und tatsächlichen Werten und bestraft grössere Abweichungen stärker.|
|
||||
|Mittlerer absoluter Fehler (MAE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)</sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul> Der mittlere absolute Fehler gibt an, wie gross die durchschnittliche absolute Differenz zwischen Vorhersagen und tatsächlichen Werten ist, ohne grössere Abweichungen zusätzlich zu gewichten.|
|
||||
|Stetige Merkmale|<ul><li>Belibigen Wert innerhalb eines Intervalls</li><li>Unendlich viele Ausprägungen</li><li>Beispiele<ul><li>Strekenlänge</li><li>Zeitintervalle</li><li>Gewicht</li></ul></li></ul>|
|
||||
|Diskrete Merkmale|<ul><li>Endliche Anzahl Ausprägungen</li><li>Menge ist zählbar</li><li>Beispiele <ul><li>Schulnoten</li><li>Haarfarben</li><li>Geschlechter</li><li>Anzahl Teilnehmer eines Sportanlasses</li></ul></li></ul>|
|
||||
|Skalenniveaus||
|
||||
@ -178,4 +178,10 @@ $$
|
||||
</div>
|
||||
|
||||
## Klassifikation
|
||||
|Begriff|Beschreibung|
|
||||
|---|---|
|
||||
|Binäre Klassifikatoren|Ein binärer Klassifikator unterscheidet zwischen zwei Klassen. Z.B. "Ziffer ist 0" vs. "Ziffer ist nicht 0"|
|
||||
|Logistische Regression|Die logistische Regression ist eine Form der Regressionsanalyse , die man verwendet, um ein nominalskaliertes, kategoriales Kriterium vorherzusagen. Das bedeutet, man verwendet die logistische Regression immer dann, wenn die abhängige Variable nur ein paar wenige, gleichrangige Ausprägungen hat. Ein Beispiel für ein kategoriales Kriterium wäre etwa der Ausgang einer Aufnahmeprüfung, bei der man nur entweder „angenommen“ oder „abgelehnt“ werden kann.|
|
||||
|Logistische Regression vs. lineare Regression|Im Gegensatz zur linearen Regression sagt man bei der logistischen Regression nicht die konkreten Werte des Kriteriums vorher. Stattdessen schätzt man, wie wahrscheinlich es ist, dass eine Person in die eine oder die andere Kategorie des Kriteriums fällt. So könntest man etwa vorhersagen, wie wahrscheinlich es ist, dass eine Person mit einem IQ von 112 die Aufnahmeprüfung bestehen wird. Für die Vorhersage verwendet man auch bei der logistischen Regression eine Regressionsgleichung. Überträgt man diese Regressionsgleichung in ein Koordinatensystem, so erhält man die charakteristische Kurve der logistischen Regression. An ihr kann man abschätzen, wie wahrscheinlich eine Merkmalsausprägung des Kriteriums für eine Person mit einem bestimmten Prädiktorwert ist und wie gut das Modell zu deinen Daten passt. Die Funktion der logistischen Regression sieht so aus: |
|
||||
|||
|
||||
## Unsupervised Learning Clustering
|
||||
Loading…
x
Reference in New Issue
Block a user