diff --git a/zusammenfassung/bilder/logistische_regression.png b/zusammenfassung/bilder/logistische_regression.png
new file mode 100644
index 0000000..6e2275f
Binary files /dev/null and b/zusammenfassung/bilder/logistische_regression.png differ
diff --git a/zusammenfassung/zusammenfassung.md b/zusammenfassung/zusammenfassung.md
index 7b63660..5d2b2b4 100644
--- a/zusammenfassung/zusammenfassung.md
+++ b/zusammenfassung/zusammenfassung.md
@@ -52,8 +52,8 @@
 |Begriff|Beschreibung|
 |---|---|
 |Explorative Datenanalyse|Explorative Datenanalyse (EDA) bezeichnet den Prozess, bei dem Daten untersucht, visualisiert und beschrieben werden, um erste Einsichten zu gewinnen, Zusammenhänge zu erkennen und Hypothesen zu formulieren — noch bevor Modellierung oder Hypothesentestsstattfinden.|
-|Mittlere quadratische Abweichung (RMSE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)</sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>![RMSE](bilder/rmse.png) Die mittlere quadratische Abweichung misst den durchschnittlichen quadratischen Unterschied zwischen vorhergesagten und tatsächlichen Werten und bestraft größere Abweichungen stärker.|
-|Mittlerer absoluter Fehler (MAE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)</sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>![MAE](bilder/mae.png) Der mittlere absolute Fehler gibt an, wie groß die durchschnittliche absolute Differenz zwischen Vorhersagen und tatsächlichen Werten ist, ohne größere Abweichungen zusätzlich zu gewichten.|
+|Mittlere quadratische Abweichung (RMSE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)</sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>![RMSE](bilder/rmse.png) Die mittlere quadratische Abweichung misst den durchschnittlichen quadratischen Unterschied zwischen vorhergesagten und tatsächlichen Werten und bestraft grössere Abweichungen stärker.|
+|Mittlerer absoluter Fehler (MAE)|<ul><li>*m* ist die Anzahl Datenpunkte im Datensatz</li><li>*h* ist die Vorhersagefunktion des Systems</li><li>*X* ist die Matrix mit den Werten sämtlicher Merkmale</li><li>*x<sup>(i)</sup>* Vektor der Werte aller Merkmale</li><li>*y<sup>(i)<sup>* Label (gewünschter Ausgabewert)</li></ul>![MAE](bilder/mae.png) Der mittlere absolute Fehler gibt an, wie gross die durchschnittliche absolute Differenz zwischen Vorhersagen und tatsächlichen Werten ist, ohne grössere Abweichungen zusätzlich zu gewichten.|
 |Stetige Merkmale|<ul><li>Belibigen Wert innerhalb eines Intervalls</li><li>Unendlich viele Ausprägungen</li><li>Beispiele<ul><li>Strekenlänge</li><li>Zeitintervalle</li><li>Gewicht</li></ul></li></ul>|
 |Diskrete Merkmale|<ul><li>Endliche Anzahl Ausprägungen</li><li>Menge ist zählbar</li><li>Beispiele <ul><li>Schulnoten</li><li>Haarfarben</li><li>Geschlechter</li><li>Anzahl Teilnehmer eines Sportanlasses</li></ul></li></ul>|
 |Skalenniveaus|![Skalenniveaus](bilder/skalenniveaus.png)|
@@ -178,4 +178,10 @@ $$
 </div>
 
 ## Klassifikation
+|Begriff|Beschreibung|
+|---|---|
+|Binäre Klassifikatoren|Ein binärer Klassifikator unterscheidet zwischen zwei Klassen. Z.B. "Ziffer ist 0" vs. "Ziffer ist nicht 0"|
+|Logistische Regression|Die logistische Regression ist eine Form der Regressionsanalyse , die man verwendet, um ein nominalskaliertes, kategoriales Kriterium vorherzusagen. Das bedeutet, man verwendet die logistische Regression immer dann, wenn die abhängige Variable nur ein paar wenige, gleichrangige Ausprägungen hat.  Ein Beispiel für ein kategoriales Kriterium wäre etwa der Ausgang einer Aufnahmeprüfung, bei der man nur entweder „angenommen“ oder „abgelehnt“ werden kann.|
+|Logistische Regression vs. lineare Regression|Im Gegensatz zur linearen Regression  sagt man bei der logistischen Regression nicht die konkreten Werte des Kriteriums vorher. Stattdessen schätzt man, wie wahrscheinlich es ist, dass eine Person in die eine oder die andere Kategorie des Kriteriums fällt. So könntest man etwa vorhersagen, wie wahrscheinlich es ist, dass eine Person mit einem IQ von 112 die Aufnahmeprüfung bestehen wird. Für die Vorhersage verwendet man auch bei der logistischen Regression eine Regressionsgleichung. Überträgt man diese Regressionsgleichung in ein Koordinatensystem, so erhält man die charakteristische Kurve der logistischen Regression. An ihr kann man abschätzen, wie wahrscheinlich eine Merkmalsausprägung des Kriteriums für eine Person mit einem bestimmten Prädiktorwert ist und wie gut das Modell zu deinen Daten passt. Die Funktion der logistischen Regression sieht so aus: ![Logistische Regression](bilder/logistische_regression.png)|
+|||
 ## Unsupervised Learning Clustering
\ No newline at end of file