2.0 KiB
2.0 KiB
Repository für Leistungsnachweis 2 cds-1011 Einführung in Data Science
Verwendung
Etwickelt in Python 3.13.7
-
Verwendete Python Bibliotheken
- pandas 2.3.3
- numpy 2.3.5
- matplotlib 3.10.7
- openpyxl 3.1.5
- scikit-learn 1.7.2
- seaborn 0.13.2
-
main.py
- python3 main.py Pfad zu .csv Datei
-
py/generate_synthetic_shots.py
- python3 generate_synthetic_shots.py Anzahl Schüsse
Ziel
Sie trainieren und evaluieren ein (supervised) Machine Learning Model um eine Fragestellung aus dem Themengebiet «Fitness» zu beantworten.
Auftrag
Für die folgenden Aufträge können Sie je nach Vorkenntnisse beliebige Tools (Python, Excel, R, Matlab, Tableau) nützen. Eigene Programmierungen sind notwendig zur Lösung der Aufgabe. Lösen Sie die Aufgabe in kleinen Gruppen (2-3 Personen).
- Auftrag
- Fragestellung definieren
- Beschaffen Sie sich Daten.
- Erkunden Sie die Daten, um daraus Erkenntnisse zu gewinnen.
- Bereiten Sie die Daten so auf, dass Machine-Learning-Algorithmen die Muster darin leichter erkennen können.
- Probieren Sie 2-3 Modelle aus und treffen Sie eine engere Auswahl.
- Optimieren Sie Ihre Modelle und kombinieren Sie diese zu einer guten Lösung.
- Dokumentieren Sie die Erkenntnisse
- Deployment und Überwachung des Systems (optional)
- Fragestellung und Datensatz aus dem ersten Leistungsnachweis kann übernommen oder weiterentwickelt werden, oder eine neue Fragestellung mit einem neuen Datensatz (eigenen oder fremden) wird bearbeitet
- Dokumentieren Sie die Erkenntnisse in Form eines wissenschaftlichen Berichts (LaTeX Vorlage für Semesterarbeit)
- Einleitung
- Stand der Forschung
- Forschungsfrage(n) und Methodik
- Resultate
- Diskussion
- Zusammenfassung
- Ausblick
- 2-3 Seiten
- APA
- Möglicher Inhalt
- Umfang
- Zitate
Allfällige Fragen stellen Sie im Modulforum.
Termin
04.12.2025
Abgabe und Bewertung
Folgende Artefakte sind Teil der Abgabe:
- Wissenschaftlicher Bericht
- Datensatz
- Quellcode
Sie erhalten ein schriftliches Feedback.