This commit is contained in:
git-sandro 2026-01-25 13:35:10 +01:00
parent f1ab27b874
commit 14909494fc

View File

@ -315,15 +315,29 @@ $$
|K-Means vs. Hierarchical handling compact vs. DBSCAN|Die Abbildung zeigt einen Datensatz mit Clustering-Algorithmen: K-Means und Hierarchical handling compact, sphärische Cluster mit unterschiedlicher Rauschtoleranz, während DBSCAN Cluster mit beliebiger Form und Rauschbehandlung verarbeitet. <img src="bilder/dbscan.webp" alt="DBSCAN" width="600" />| |K-Means vs. Hierarchical handling compact vs. DBSCAN|Die Abbildung zeigt einen Datensatz mit Clustering-Algorithmen: K-Means und Hierarchical handling compact, sphärische Cluster mit unterschiedlicher Rauschtoleranz, während DBSCAN Cluster mit beliebiger Form und Rauschbehandlung verarbeitet. <img src="bilder/dbscan.webp" alt="DBSCAN" width="600" />|
### Silhouette Koeffizient ### Silhouette Koeffizient
Der Silhouette koeffizient ist eine Kennzahl, die misst, wie gut jeder Datenpunkt in den ihm zugewiesenen Cluster passt. Er kombiniert Informationen sowohl über die Kohäsion (wie nah ein Datenpunkt an anderen Punkten in seinem eigenen Cluster liegt) als auch über die Trennung (wie weit ein Datenpunkt von Punkten in anderen Clustern entfernt ist) des Datenpunkts. Der Silhouette koeffizient ist eine Kennzahl, die misst, wie gut jeder Datenpunkt in den ihm zugewiesenen Cluster passt. Er kombiniert Informationen sowohl über die "Cohesion" (wie nah ein Datenpunkt an anderen Punkten in seinem eigenen Cluster liegt) als auch über die "Separation" (wie weit ein Datenpunkt von Punkten in anderen Clustern entfernt ist) des Datenpunkts.
* Der Koeffizient reicht von -1 bis 1 * Der Koeffizient reicht von -1 bis 1
* Ein Wert nahe 1 weist auf einen gut gruppierten Datenpunkt hin * Ein Wert nahe 1 weist auf einen gut gruppierten Datenpunkt hin
* Ein Wert nahe 0 deutet auf überlappende Cluster hin * Ein Wert nahe 0 deutet auf überlappende Cluster hin
* Ein Wert nahe -1 weist auf einen falsch klassifizierten Datenpunkt hin * Ein Wert nahe -1 weist auf einen falsch klassifizierten Datenpunkt hin
Beispiel: Beispiel Silhouette Koeffizient für Punkt A1 berechnen:
<div align="center"> <div align="center">
<img src="bilder/silhouette.png" alt="Ausganslage Silhouette Graph" width="600"> <img src="bilder/silhouette.png" alt="Ausganslage Silhouette Graph" width="500">
</div> </div>
1. Cohesion für Punk A1 berechnen
$$
cohesion = \frac{Euklidische Distanz zu Punkte im gleichen Cluster}{n}
$$
$$
d(A1,A2)=\sqrt{(2-3)^2+(5-4)^2}=\sqrt{2}
$$
$$
d(A1,A2)=\sqrt{(2-4)^2+(5-6)^2}=\sqrt{5}
$$
$$
cohesion(A1)=\frac{\sqrt{2}+\sqrt{5}}{2}=1.825
$$