dbscan
This commit is contained in:
parent
beebc97891
commit
583c732df8
BIN
zusammenfassung/bilder/dbscan.webp
Normal file
BIN
zusammenfassung/bilder/dbscan.webp
Normal file
Binary file not shown.
|
After Width: | Height: | Size: 20 KiB |
BIN
zusammenfassung/bilder/elbow_method.webp
Normal file
BIN
zusammenfassung/bilder/elbow_method.webp
Normal file
Binary file not shown.
|
After Width: | Height: | Size: 8.7 KiB |
@ -303,4 +303,13 @@ $$
|
||||
|
||||
<div align="center">
|
||||
<img src="bilder/k_means_graph_2.png" alt="K-Means Graph 2" width="500" />
|
||||
</div>
|
||||
</div>
|
||||
|
||||
|Begriff|Beschreibung|
|
||||
|---|---|
|
||||
|Elbow-Method|Beim K-Means Clustering unterteilt der Algorithmus Daten in k Cluster, indem er die Abstände zwischen Punkten und ihren Clusterzentren minimiert. Die Entscheidung für das ideale k ist jedoch nicht einfach. Die Elbow-Methode hilft dabei, indem sie die Summenquadrate innerhalb der Cluster (WCSS) gegen steigende k-Werte aufträgt und nach einem Punkt sucht, an dem sich die Verbesserung verlangsamt. Dieser Punkt wird als „Elbow“ bezeichnet. <img src="bilder/elbow_method.webp" alt="Elbow Method" width="600"|
|
||||
|Dimensionsreduktion|Im Bereich des maschinellen Lernens ist es sinnvoll, hochdimensionale Daten einem Prozess namens Dimensionsreduktion zu unterziehen. Der Zweck dieses Prozesses besteht darin, die Anzahl der betrachteten Merkmale zu reduzieren, wobei jedes Merkmal eine Dimension ist, die die Objekte teilweise repräsentiert.|
|
||||
|PCA|Principal Component Analysis ist eine Technik, mit der hochdimensionale Daten in niedrigdimensionale Daten umgewandelt werden, wobei so viele Informationen wie möglich erhalten bleiben. Sie wird zur Interpretation und Visualisierung von Daten verwendet. Die Anzahl der Variablen nimmt ab, was die weitere Analyse vereinfacht.|
|
||||
|Teilüberwachtes Lernen (Semi-Supervised Learning)|Teilüberwachtes Lernen ist ein hybrider Ansatz des maschinellen Lernens, der sowohl überwachtes als auch unüberwachtes Lernen nutzt. Dabei wird eine kleine Menge gekennzeichneter Daten in Kombination mit einer grossen Menge ungekennzeichneter Daten zum Trainieren von Modellen verwendet. Das Ziel besteht darin, eine Funktion zu erlernen, die ähnlich wie beim überwachten Lernen anhand von Eingaben präzise Vorhersagen zu den Ausgaben trifft, jedoch mit deutlich weniger gekennzeichneten Daten.|
|
||||
|DBSCAN|DBSCAN ist ein dichtebasierter Clustering-Algorithmus, der dicht beieinander liegende Datenpunkte gruppiert und Ausreisser anhand ihrer Dichte im Merkmalsraum als Rauschen markiert. Er identifiziert Cluster als dichte Bereiche im Datenraum, die durch Bereiche mit geringerer Dichte voneinander getrennt sind. Im Gegensatz zu K-Means oder hierarchischem Clustering, bei denen davon ausgegangen wird, dass Cluster kompakt und kugelförmig sind, eignet sich DBSCAN gut für die Verarbeitung von Unregelmäßigkeiten in realen Daten, wie z. B.:<ul><li>Beliebig geformte Cluster: Cluster können jede beliebige Form annehmen, nicht nur kreisförmig oder konvex.</li><li>Rauschen und Ausreißer: Es identifiziert und behandelt Rauschpunkte effektiv, ohne sie einem Cluster zuzuordnen.</li></ul>|
|
||||
|K-Means vs. Hierarchie vs. DBSCAN|<img src="bilder/dbscan.webp" alt="DBSCAN" width="600" />|
|
||||
Loading…
x
Reference in New Issue
Block a user