Data Science: Statistik
Überblick
Statistik und Wahrscheinlichkeitsrechnung verfolgen uns tagtäglich. Hilft ein bestimmtes Medikament gegen Kopfschmerzen? Wie lange warte ich im Schnitt auf die U-Bahn? Können Frauen besser Autofahren als Männer? Und natürlich sind statistische Verfahren auch nicht aus der Welt der BWL, VWL oder Soziologie wegzudenken. Zieht ein neues Webseiten-Design mehr Käufer an als das alte? Wie viele Kunden sollte eine Firma befragen, um belastbare Aussagen über die Interessen ihrer gesamten Kundschaft treffen zu können?
Dieser Kurs gibt eine Einführung in statistische Methoden, die im Bereich Data Science dazu gebraucht werden, um i) Zufallsvorgänge zu analysieren, ii) Datenerhebungen zu planen, iii) von Stichproben auf ganze Populationen zu schließen und iv) statistische Hypothesentests durchzuführen.
Da mehr und mehr Berufsbilder in Wirtschaft und Forschung das praktische Arbeiten mit Datensätzen beinhalten, umfasst der Kurs auch eine Einführung in die praktische Umsetzung der Methoden mittels der Statistiksoftware R.
Studierende, die den Kurs erfolgreich abschließen, können i) grundlegende Stichprobenverfahren erläutern, ii) Parameter von Verteilungen schätzen, iii) verschiedene Arten von Hypothesentests anwenden, iv) induktive Methoden als Grundlage des Arbeitens in empirischen Wissenschaften einsetzen und statistische Ergebnisse kritisch überprüfen und v) die behandelten Methoden praktisch in der Statistiksoftware R implementieren.
Kursorganisation
Das Modul hat einen Umfang von 5 ECTS und wird jeweils in der zweiten Hälfte des Wintersemesters unterrichtet (im Anschluss an das Modul „Data Science – Datenauswertung“, das auch Grundvoraussetzung ist, um dem Stoff dieses Moduls folgen zu können). Kurssprache ist Deutsch.
Der Kurs läuft über die Hälfte des Semesters und besteht in dieser Zeit aus zwei Vorlesungen pro Woche (2 SWS), einer Übung (1 SWS), einer R-Übung (1 SWS), sowie einem Tutorium (fakultativ, 1 SWS).
In den Sommersemestern bietet der Lehrstuhl zusätzliche Übungen an. Bitte während des Semesters Informationen auf StudOn beachten.
Hinweise zur Klausur
Das Modul wird mit einer schriftlichen Klausur (60 Minuten) im Single-Choice-Format geprüft, die auch Fragen zur praktischen Umsetzung statistischer Analysen in R beinhaltet. Die erste Prüfung findet in der Prüfungsperiode am Ende des Wintersemesters statt. Eine Möglichkeit zum Wiederholen der Prüfung gibt es in der Prüfungsperiode am Ende des Sommersemesters.
Als Hilfsmittel bei der Klausur sind zugelassen:
- die vom Lehrstuhl herausgegebene Formelsammlung (farbliche Hinterlegung von Textpassagen und/oder Formeln oder Post-Its ohne Beschriftung sind gestattet, andere Einträge nicht)
- ein nicht-programmierbarer Taschenrechner
- das auf StudOn verlinkte Hilfsblatt über Grundlagen von R
Zur Orientierung können Sie sich alte Klausuren anschauen. Wir stellen eine Auswahl auf dieser Seite zum Download zur Verfügung. Sie finden dort auch Altkausuren des Vorgängermoduls „Statistik“. Bitte beachten Sie, dass das Format dieser Klausuren anders ist (vor dem Wintersemester 2019/20 nur Freitextaufgaben, danach ein Mix aus Freitext- und Single-Choice-Aufgaben) und auch ein breiteres Spektrum an Inhalten abgedeckt; Sie können diese Klausuren aber natürlich trotzdem in Teilen nutzen, um sich auf die Klausur vorzubereiten.
Hinweise zur Literatur
Die Vorlesung orientiert sich an folgendem Lehrbuch, das für Sie in der FAU-Bibliothek online verfügbar ist:
- Schlittgen, Rainer (2012), Einführung in die Statistik – Analyse und Modellierung von Daten (12. Auflage), Oldenbourg Wissenschaftsverlag GmbH, München.
Für den Themenbereich „Stichprobenverfahren“ ist außerdem das folgende Lehrbuch relevant:
- Kauermann, Göran und Helmut Küchenhoff (2010), Stichproben – Methoden und praktische Umsetzung in R, Springer, Heidelberg.
Darüber hinaus empfehlen wir für Studierende, die nach weiterer Literatur über die Grundlagen der Statistik suchen, die beiden folgenden Lehrbücher:
- Mosler, Karl und Friedrich Schmid (2006), Beschreibende Statistik und Wirtschaftsstatistik, 3. Ausgabe, Springer, Heidelberg.
- Mosler, Karl und Friedrich Schmid (2006), Wahrscheinlichkeitsrechnung und schließende Statistik, 2. Ausgabe, Springer, Heidelberg.
Syllabus
Detaillierte Informationen über den Kurs finden Sie zusammengefasst auch im aktuellen Syllabus (Version fürs Wintersemester 2024/25).
Mathematikgrundlagen
Die naturwissenschaftliche Faktultät der FAU bietet auf StudOn eine Seite an, mit Hilfe derer Sie den Mathematikstoff aus der Mittelstufe und Oberstufe wiederholen können. Wir empfehlen, dass Sie diese Seite nutzen, um für sich zu kontrollieren, ob Sie diese Grundlagen beherrschen. Falls nicht bietet die Seite auch Übungsaufgaben an, mit denen Sie Ihr Wissen auffrischen können.