Data Science Seminare
Seit 2015 unterrichte ich Statistik, zunächst mir R und Minitab, dann auch mit Python und in Kombination mit MS Azure / Fabric oder der Oracle Datenbank.
Ein Data Science Kurs mit R oder Python vermittelt die Grundlagen und fortgeschrittenen Techniken zur Analyse und Interpretation von Daten. Ein solcher Kurs ist ideal für Daten Analysten, Data Scientists oder alle, die datengetriebene Entscheidungen treffen wollen.
Meine Seminare umfassen die folgenden Themen:

Grundlagen der Programmiersprache
- Syntax und Datenstrukturen (Listen, Dictionaries, DataFrames)
- Funktionen und Kontrollstrukturen (Schleifen, Bedingungen)
- Pakete und Bibliotheken (z. B. pandas, numpy, ggplot2, dplyr)
Datenaufbereitung und -manipulation
- Laden, Bereinigen und Transformieren von Daten
- Umgang mit fehlenden Werten und Anomalien
- Aggregationen und Pivot-Tabellen
Datenvisualisierung
- Diagramme und Grafiken erstellen (Matplotlib, Seaborn, ggplot2)
- Interaktive Dashboards (Shiny für R, Plotly für Python)
Statistische Analyse
- Deskriptive Statistik (Mittelwerte, Streuung, Korrelationen)
- Hypothesentests und Signifikanzanalysen
- Wahrscheinlichkeitsverteilungen
Maschinelles Lernen
- Supervised Learning (Regression, Klassifikation)
- Unsupervised Learning (Clustering, Dimensionalitätsreduktion)
- Evaluierung von Modellen (Train-Test-Split, Cross-Validation)
Big Data und Cloud-Technologien (optional)
- Verarbeitung großer Datenmengen mit Spark (PySpark, SparkR)
- Einsatz von Cloud-Diensten (z. B. Azure ML, AWS SageMaker)
R

Komplexe Datenanalyse erfordert Unterstützung durch eine Statistik-Umgebung. Hier habe ich mich für R entschieden, da Open Source mit einer beeindruckenden Vielzahl an Analyse-Paketen zusammenfällt.
- R Grundlagen
- R Data Mining
- R Multivariate Verfahren Kurs I und Kurs II
- R Zeitreihenanalyse
- R Regressionsanalyse
Python

Möchte man statistische Analysen umfassend in größerer Software einbinden, ist Python die geeignete Wahl.
- Python Grundlagen Statistik
- Python Data Mining
- Python Multivariate Verfahren
- Python Zeitreihenanalyse
Minitab

Für Produktion und Qualität gibt es besondere statistische Verfahren.
Die Seminare führe ich mit Minitab durch, dem führenden Statistik-Produkt im Bereich Ingenieur-Statistik.
- Design of Experiments (DOE)
- Statistical Process Control (DOE)
- Ingenieurstatistik mit Minitab