Teaching > Data Literacy > Datenmanipulation & Datenanalyse mit Python
Datenmanipulation & Datenanalyse mit Python
Die Veranstaltung beginnt mit einer Einordnung des Begriffs “Data Science” in den übergeordneten Kontext der “Data Literacy”. Es folgt eine Diskussion des Anforderungsprofils des Data Scientists sowie ein Überblick über den generischen Data Science Workflow. Dabei wird aufgezeigt die Kenntnisse einer Programmiersrache (z.B. Python) zur Analyse von Daten heutzutage unabdingbar ist.
Der zweite Teil der Veranstaltung beginnt mit einer grundlegenden Einführung in die Programmiersprache Python, gepaart mit diversen praktischen Beispielen und Übungen. Im Fokus steht die Arbeit mit Jupyter Notebooks zur Vertiefung der Inhalte über Datentypen, Datenstrukturen, Vergleichsoperatoren und Funktionen.
Im dritten (Haupt-)Teil der Veranstaltung folgt zunächst eine kurze Diskussion verschiedener Datenmodalitäten (Tabellarische Daten, Text, Bild, Audio) bevor die Teilnehmer:innen die grundlegenden Funktionen zur Manipulation und Analyse tabellerischer Daten in Python kennenlernen. Themenschwerpunkte sind dabei der Datenimport, die primären Datenmanipulationen auf Zeilen- und Spalten-Ebene, die Berechnung und Interpretation von Statistiken sowie das Gruppieren und Mergen von Datensätzen. Analog zu Teil zwei wechseln sich dabei theoretische Einheiten mit hands-on Einheiten und Übungen ab. Alle Beispiele werden anhand eines realen Datensatzes und unter Verwendung der Python Library pandas
verdeutlicht.