Data Science: Datenauswertung
Überblick
Statistik und Wahrscheinlichkeitsrechnung verfolgen uns tagtäglich. Hilft ein bestimmtes Medikament gegen Kopfschmerzen? Wie lange warte ich im Schnitt auf die U-Bahn? Können Frauen besser Autofahren als Männer? Und natürlich sind statistische Verfahren auch nicht aus der Welt der BWL, VWL oder Soziologie wegzudenken. Wie hoch ist das durchschnittliche Haushaltseinkommen in Deutschland? In welchem Land sind die Einkommen besonders ungleich verteilt? Dauert es im Schnitt weniger als 6 Monate bis ein(e) Arbeitslose(r) wieder einen Job gefunden hat?
Dieser Kurs gibt eine Einführung in statistische Methoden, die im Bereich Data Science dazu gebraucht werden, um i) Daten zu beschreiben, und v) große Datensätze mittels Maschinellen Lernens zu analysieren.
Da mehr und mehr Berufsbilder in Wirtschaft und Forschung das praktische Arbeiten mit Datensätzen beinhalten, umfasst der Kurs auch eine Einführung in die praktische Umsetzung der Datenauswertung mittels der Statistiksoftware R.
Studierende, die den Kurs erfolgreich abschließen, können i) Datensätze mittels geeigneter Maßzahlen beschreiben, ii) geeignete Formen zur Visualisierung von Daten auswählen, iii) die Funktionsweise ausgewählter Verfahren des Maschinellen Lernens erklären und iv) die behandelten Methoden praktisch in der Statistiksoftware R implementieren.
Kursorganisation
Das Modul hat einen Umfang von 5 ECTS und wird jeweils in der ersten Hälfte des Wintersemesters unterrichtet. Kurssprache ist Deutsch.
Der Kurs läuft über die Hälfte des Semesters und besteht in dieser Zeit aus zwei Vorlesungen pro Woche (2 SWS), einer Übung (1 SWS), einer R-Übung (1 SWS). Das fakultative Tutorium bieten wir wahlweise in Form von Lösungsvideos, mit denen Studierende die Aufgabenblätter eigenständig bearbeiten können, oder Präsenztutorien an, in denen Fragen zu den Aufgabenblättern gestellt werden können.
In den Sommersemestern bietet der Lehrstuhl zusätzliche Übungen an. Bitte während des Semesters Informationen auf StudOn beachten.
Hinweise zur Klausur
Das Modul wird mit einer schriftlichen Klausur (60 Minuten) im Single-Choice-Format geprüft, die auch Fragen zur praktischen Umsetzung statistischer Analysen in R beinhaltet. Die erste Prüfung findet in der Mitte des Wintersemesters im Dezember statt. Eine Möglichkeit zum Wiederholen der Prüfung gibt es in der regulären Prüfungsperiode am Ende des Wintersemesters.
Als Hilfsmittel bei der Klausur sind zugelassen:
- die vom Lehrstuhl herausgegebene Formelsammlung (farbliche Hinterlegung von Textpassagen und/oder Formeln oder Post-Its ohne Beschriftung sind gestattet, andere Einträge nicht)
- ein nicht-programmierbarer Taschenrechner
- das auf StudOn verlinkte Hilfsblatt über Grundlagen von R
Zur Orientierung können Sie sich alte Klausuren anschauen. Wir stellen eine Auswahl auf dieser Seite zum Download zur Verfügung. Sie finden dort auch Altkausuren des Vorgängermoduls „Statistik“. Bitte beachten Sie, dass das Format dieser Klausuren anders ist (vor dem Wintersemester 2019/20 nur Freitextaufgaben, danach ein Mix aus Freitext- und Single-Choice-Aufgaben) und auch ein breiteres Spektrum an Inhalten abgedeckt; Sie können diese Klausuren aber natürlich trotzdem in Teilen nutzen, um sich auf die Klausur vorzubereiten.
Hinweise zur Literatur
Die Vorlesung orientiert sich an folgendem Lehrbuch, das für Sie in der FAU-Bibliothek online verfügbar ist:
- Schlittgen, Rainer (2012), Einführung in die Statistik – Analyse und Modellierung von Daten (12. Auflage), Oldenbourg Wissenschaftsverlag GmbH, München.
Für den Themenbereich „Maschinelles Lernen“ ist außerdem das folgende Lehrbuch relevant:
- James, Gareth, Daniela Witten, Trevor Hastie und Robert Tibsirani (2013), An Introduction to Statistical Learning, Springer, Heidelberg.
Darüber hinaus empfehlen wir für Studierende, die nach weiterer Literatur über die Grundlagen der Statistik suchen, die beiden folgenden Lehrbücher:
- Mosler, Karl und Friedrich Schmid (2006), Beschreibende Statistik und Wirtschaftsstatistik, 3. Ausgabe, Springer, Heidelberg.
- Mosler, Karl und Friedrich Schmid (2006), Wahrscheinlichkeitsrechnung und schließende Statistik, 2. Ausgabe, Springer, Heidelberg.
Syllabus
Detaillierte Informationen über den Kurs finden Sie zusammengefasst auch im aktuellen Syllabus (Version fürs Wintersemester 2024/25).
Mathematikgrundlagen
Die naturwissenschaftliche Faktultät der FAU bietet auf StudOn eine Seite an, mit Hilfe derer Sie den Mathematikstoff aus der Mittelstufe und Oberstufe wiederholen können. Wir empfehlen, dass Sie diese Seite nutzen, um für sich zu kontrollieren, ob Sie diese Grundlagen beherrschen. Falls nicht bietet die Seite auch Übungsaufgaben an, mit denen Sie Ihr Wissen auffrischen können.