diff --git a/zusammenfassung/zusammenfassung.md b/zusammenfassung/zusammenfassung.md index 02d3610..04f956e 100644 --- a/zusammenfassung/zusammenfassung.md +++ b/zusammenfassung/zusammenfassung.md @@ -200,5 +200,5 @@ $$ |Clustering|Clustering kann als das wichtigste Problem des unüberwachten Lernens angesehen werden. Es befasst sich mit der Suche nach einer Struktur in einer Sammlung unbeschrifteter Daten. Eine grobe Definition von Clustering könnte der Prozess der Organisation von Objekten in Gruppen sein, deren Mitglieder sich in irgendeiner Weise ähneln. Ein Cluster ist daher eine Sammlung von Objekten, die sich untereinander ähneln und sich von den Objekten anderer Cluster unterscheiden.| |Distanzmasse|Festzustellen, welche Datenpunkte innerhalb eines Clusters sich ähnlicher sind als andere. Distanzmasse werden tendenziell kleiner, je ähnlicher zwei Punkte sich sind.
Beispiele:| |Ähnlichkeitsmasse|Bei Ähnlichkeitsmassen ist es andersherum: Bei größerer Ähnlichkeit zwischen zwei Punkten steigt ihr Wert.
Beispiele:| -|Euklidische Distanz|Abstand zwischen zwei Vektoren im mehrdimensionalen Raum. Bei der quadrierten euklidischen Distanz werden grosse Abstände zwishen den Vektoren stärker gewichtet als kleine Abstände. $\large d(x,y)=\sqrt{\sum{i=1}{n} (x_i-y_i)^2}$| +|Euklidische Distanz|Abstand zwischen zwei Vektoren im mehrdimensionalen Raum. Bei der quadrierten euklidischen Distanz werden grosse Abstände zwishen den Vektoren stärker gewichtet als kleine Abstände. $\large d(x,y)=\sqrt{\sum_{i=1}^{n} (x_i-y_i)^2}$| ||| \ No newline at end of file