Schulungsübersicht

Einführung in das maschinelle Lernen

  • Arten des maschinellen Lernens – überwacht vs. unüberwacht
  • Von statistischem Lernen zum maschinellen Lernen
  • Der Workflow des Datenminings: Geschäftsverständnis, Datenvorbereitung, Modellierung, Bereitstellung
  • Auswahl des richtigen Algorithmus für die Aufgabe
  • Überanpassung und der Bias-Variance-Kompromiss

Übersicht über Python und ML-Bibliotheken

  • Warum Programmiersprachen für das maschinelle Lernen verwendet werden
  • Auswahl zwischen R und Python
  • Schnellkurs in Python und Jupyter Notebooks
  • Python-Bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testen und Evaluieren von ML-Algorithmen

  • Verallgemeinerung, Überanpassung und Modellvalidierung
  • Evaluationsstrategien: Holdout, Kreuzvalidierung, Bootstrapping
  • Metriken für Regression: ME, MSE, RMSE, MAPE
  • Metriken für Klassifizierung: Genauigkeit, Verwirrungsmatrix, unbalancierte Klassen
  • Modellleistung visualisieren: Profitkurve, ROC-Kurve, Lift-Kurve
  • Modellauswahl und Grid-Search zur Feinabstimmung

Datenvorbereitung

  • Dateneinfuhr und -speicherung in Python
  • Explorative Analyse und Zusammenfassungsstatistiken
  • Bearbeitung fehlender Werte und Ausreißer
  • Standardisierung, Normalisierung und Transformation
  • Kodierung qualitativer Daten und Datenbearbeitung mit pandas

Klassifizierungs-Algorithmen

  • Binäre vs. multiklassen Klassifizierung
  • Logistische Regression und Diskriminanzfunktionen
  • Naive Bayes, k-nächste Nachbarn
  • Entscheidungsbaume: CART, Random Forests, Bagging, Boosting, XGBoost
  • Support Vector Machines und Kerne
  • Ensemble-Lernverfahren

Regression und numerische Vorhersage

  • Kleinste Quadrate und Variablenselektion
  • Regularisierungsmethoden: L1, L2
  • Polyregression und nichtlineare Modelle
  • Regessionstrees und Splines

Unüberwachtes Lernen

  • Klusteranalysetechniken: k-means, k-medoids, hierarchische Clustering, SOMs
  • Dimensionsreduktion: PCA, Faktorenanalyse, SVD
  • Mehrdimensionale Skalierung

Textmining

  • Vorverarbeitung von Text und Tokenisierung
  • Bag-of-Words, Stammformbildung und Lemmatisierung
  • Sentimentanalyse und Wortfrequenz
  • Visualisierung von Textdaten mit Word Clouds

Empfehlungssysteme

  • Nutzer- und elementbasierte kollaborative Filterung
  • Entwurf und Evaluierung von Empfehlungsmotoren

Minen von Assoziationsmustern

  • Häufige Itemsets und Apriori-Algorithmus
  • Market Basket Analyse und Lift-Verhältnis

Auffälligkeitsdetektion

  • Extreme-Wertanalyse
  • Distanz- und dichteorientierte Methoden
  • Auffälligkeitsdetektion in hochdimensionalen Daten

Fallstudie zum maschinellen Lernen

  • Verstehen des Geschäftsproblems
  • Datenvorbereitung und Feature Engineering
  • Modellauswahl und Parametertuning
  • Evaluierung und Präsentation der Ergebnisse
  • Bereitstellung

Zusammenfassung und weitere Schritte

Voraussetzungen

  • Grundverständnis von Statistik und linearer Algebra
  • Bekanntschaft mit Datenanalyse oder Business-Intelligence-Konzepten
  • Eine gewisse Erfahrung mit der Programmierung (vorzugsweise Python oder R) wird empfohlen
  • Interesse am Lernen von angewandtem Maschinellem Lernen für datengestützte Projekte

Zielgruppe

  • Datenanalysten und -wissenschaftler
  • Statistiker und Forschungsfachleute
  • Entwickler und IT-Professionals, die sich mit Maschinellem Lernen vertraut machen möchten
  • Jeder, der an Datenwissenschaft oder prädiktiver Analyse beteiligt ist
 21 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (3)

Kommende Kurse

Verwandte Kategorien