31 lines
2.1 KiB
Markdown
31 lines
2.1 KiB
Markdown
# Zusammenfassung für CDS-1011 Einführung in Data Science
|
|
## Grundbegriffe
|
|
| Begriff | Beschreibung |
|
|
|---|---|
|
|
| Daten | Beispiele: Transaktionsdaten, Log-Daten, Maschinendaten, Dokumente / Texte, Social Media, Videos, Bilder |
|
|
| Data Science | Fachgebiet, welches sich mit der Gewinnung von Wissen aus Daten beschäftigt |
|
|
| Artificial Intelligence | Systeme, die intelligentes Verhalten aufweisen. Indem sie ihre Umgebung analysieren und Massnahmen ergreiffen, mit einen gewissen Grad an Selbstbestimmung. Um dann bestimmte Ziele zu erreichen |
|
|
| Machine Learning | Machine Learning beschäftigt sich mit der Frage, wie man Computer Programme so entwerfen kann, dass sie sich, mit Erfahrung, automatisch verbessern |
|
|
| Deep Learning | Deep Learning ist eine unterkategorie von AI, die ihren Fokus auf die Erstellung von künstlichen neuronalen Netzen (KNN) setzt. KNN sind in der Lage, genaue datengestützte Entscheidungen zu treffen |
|
|
## Machine Larning
|
|
| Begriff | Beschreibung |
|
|
|---|---|
|
|
|Überwachtes Lernen|<ul><li>Überwchtes Lernen nutzt Beispieldaten mit einer Zielvariable, um aus diesen Daten Muster zu erlernen und diese auf unbekannte Daten anzuwenden </li><li>Wird für Klassifikationen und Regressionen genutzt, also für die Vorhersage von Wahrscheinlichkeiten oder numerischen Werten</li><li>Überwachtes Lernen setzt eine aufwendige Datenvorverarbeitung voraus</li></ul>|
|
|
|Klassifizierung|Methode des überwachten Lernens, bei der ein Modell anhand von gelabelten Beispieldaten lernt, neue Datenpunkte vordefinierten Kategorien (Klassen) zuzuordnen, z.B. Bilder als "Hund" oder "Katze" zu erkennen, Spam-Mails zu filtern oder Kunden abzuwandern|
|
|
|Klassifizierung Algorithmen|<ul><li>K-Nearest-Neighbors</li><li>Naïve Bayes</li><li>Support Vector Machines</li><li>Decision Trees</li></ul>|
|
|
|Regression||
|
|
|Modell||
|
|
|Unüberwachtes Lernen||
|
|
|Halbüberwachtes Lernen||
|
|
|Reinforcement Learning||
|
|
|Batch Learning||
|
|
|Online Learning||
|
|
|Instanzbasiertes Lernen||
|
|
|Modellbasiertes Lernen||
|
|
|Matrizen||
|
|
|||
|
|
## Herausforderungen
|
|
## Explorative Datenanalyse
|
|
## Lineare Regression
|
|
## Klassifikation
|
|
## Unsupervised Learning Clustering |