From 8af0aa142b3bfeb8b6ba9a6b6017c36f58612764 Mon Sep 17 00:00:00 2001 From: git-sandro Date: Sun, 25 Jan 2026 09:39:49 +0100 Subject: [PATCH] clustering --- zusammenfassung/zusammenfassung.md | 9 ++++++++- 1 file changed, 8 insertions(+), 1 deletion(-) diff --git a/zusammenfassung/zusammenfassung.md b/zusammenfassung/zusammenfassung.md index dcc2b88..a92a151 100644 --- a/zusammenfassung/zusammenfassung.md +++ b/zusammenfassung/zusammenfassung.md @@ -194,4 +194,11 @@ $$ |Multiclass Classification|Multiclass Classification umfasst Datensätze mit mehreren Klassenbezeichnungen.
Binäre vs Multiclass Classification Multiclass Classification
| |One vs. The Rest|Beim One vs. Rest Klassifizierungsansatz, der auf einen Datensatz mit N unterschiedlichen Klassen zugeschnitten ist, werden N binäre Klassifikatoren generiert, die jeweils einer bestimmten Klasse entsprechen. Die Anzahl der Klassifikatoren entspricht der Anzahl der eindeutigen Klassenbezeichnungen, die im Datensatz vorhanden sind. One vs. the Rest| |One vs. One|Bei der One vs. One Klassifizierungsstrategie, die auf einen Datensatz mit N unterschiedlichen Klassen zugeschnitten ist, werden insgesamt N * (N-1) / 2 binäre Klassifikatoren generiert. Bei diesem Ansatz wird für jedes mögliche Klassenpaar ein binärer Klassifikator erstellt.
One vs. the Rest| -## Unsupervised Learning Clustering \ No newline at end of file +## Unsupervised Learning Clustering +|Begriff|Beschreibung| +|---|---| +|Clustering|Clustering kann als das wichtigste Problem des unüberwachten Lernens angesehen werden. Es befasst sich mit der Suche nach einer Struktur in einer Sammlung unbeschrifteter Daten. Eine grobe Definition von Clustering könnte der Prozess der Organisation von Objekten in Gruppen sein, deren Mitglieder sich in irgendeiner Weise ähneln. Ein Cluster ist daher eine Sammlung von Objekten, die sich untereinander ähneln und sich von den Objekten anderer Cluster unterscheiden.| +|Distanzmasse|Festzustellen, welche Datenpunkte innerhalb eines Clusters sich ähnlicher sind als andere. Distanzmasse werden tendenziell kleiner, je ähnlicher zwei Punkte sich sind.
Beispiele:
  • Euklidische Distanz
  • Minkowski Distanz
  • Canberra Distanz
| +|Ähnlichkeitsmasse|Bei Ähnlichkeitsmassen ist es andersherum: Bei größerer Ähnlichkeit zwischen zwei Punkten steigt ihr Wert.
Beispiele:
  • Cosinus Similarity
  • Pearson Korrelationskoeffiziet
  • Jaccard Koeffizient
| +||| +||| \ No newline at end of file