Schulungsübersicht

Einführung in das maschinelle Lernen

  • Arten des maschinellen Lernens – überwacht vs. nicht überwacht
  • Von der statistischen Lernmethode zum maschinellen Lernen
  • Der Data-Mining-Arbeitsablauf: Geschäftsverständnis, Datenbereitstellung, Modellierung, Bereitstellung
  • Wahl des richtigen Algorithmus für die Aufgabe
  • Überanpassung und der Bias-Variance-Tradeoff

Überblick über Python und ML-Bibliotheken

  • Warum Programmiersprachen für das maschinelle Lernen verwendet werden
  • Wahl zwischen R und Python
  • Einführung in Python und Jupyter-Notebooks
  • Python-Bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testen und Evaluieren von ML-Algorithmen

  • Generalisierung, Überanpassung und Modellvalidierung
  • Evaluierungsstrategien: Holdout, Kreuzvalidierung, Bootstrapping
  • Metriken für die Regression: ME, MSE, RMSE, MAPE
  • Metriken für Klassifikation: Genauigkeit, Verwirrungsmatrix, unbalancierte Klassen
  • Modellleistung visualisieren: Profitkurve, ROC-Kurve, Lift-Kurve
  • Modellauswahl und Grid-Search für die Optimierung

Datenbereitstellung

  • Datenimport und -speicherung in Python
  • Explorative Analyse und Zusammenfassungsstatistiken
  • Behandlung fehlender Werte und Ausreißer
  • Standardisierung, Normalisierung und Transformation
  • Umwandlung qualitativer Daten und Datenverarbeitung mit pandas

Klassifikationsalgorithmen

  • Binäre vs. multiklassen-Klassifikation
  • Logistische Regression und Diskriminanzfunktionen
  • Naive Bayes, k-nearest neighbors
  • Entscheidungsbaumverfahren: CART, Random Forests, Bagging, Boosting, XGBoost
  • Support Vector Machines und Kerne
  • Ensemble-Lernmethoden

Regression und numerische Vorhersage

  • Methode der kleinsten Quadrate und Variablenselektion
  • Regularisierungsmethoden: L1, L2
  • Polynomielle Regression und nichtlineare Modelle
  • Regressionsbäume und Splines

Neuronale Netze

  • Einführung in neuronale Netze und Deep Learning
  • Aktivierungsfunktionen, Schichten und Backpropagation
  • Multilayer Perceptrons (MLP)
  • Verwendung von TensorFlow oder PyTorch für grundlegende neuronale Netzwerkbildung
  • Neuronale Netze für Klassifikation und Regression

Umsatzprognose und prädiktive Analyse

  • Zeitreihenanalyse vs. regressionsbasierte Prognose
  • Verarbeitung saisonaler und trendbasierter Daten
  • Erstellung eines Umsatzprognosemodells mit ML-Techniken
  • Bewertung der Prognosegenauigkeit und Unsicherheit
  • Geschäftliche Interpretation und Kommunikation der Ergebnisse

Unüberwachtes Lernen

  • Clustering-Techniken: k-means, k-medoids, hierarchisches Clustering, SOMs
  • Dimensionsreduktion: PCA, Faktorenanalyse, SVD
  • Multidimensionale Skalierung

Textmining

  • Textvorverarbeitung und Tokenisierung
  • Bag-of-Words, Stammformbildung (Stemming) und Lemmatisierung
  • Sentimentanalyse und Wortfrequenz
  • Visualisierung von Textdaten mit Word Clouds

Empfehlungssysteme

  • User-based und item-based Collaborative Filtering
  • Entwicklung und Evaluierung von Empfehlungs-Engines

Assoziationsmustermining

  • Häufige Itemsets und Apriori-Algorithmus
  • Market Basket Analysis und Lift Ratio

Outlier-Detektion

  • Analyse extrem hoher Werte
  • Distanz- und Dichte-basierte Methoden
  • Outlier-Detektion in hochdimensionalen Daten

Maschinelles Lernen Case Study

  • Verständnis des Geschäftsproblems
  • Datenvorverarbeitung und Feature Engineering
  • Modellauswahl und Parameteroptimierung
  • Evaluierung und Präsentation der Ergebnisse
  • Bereitstellung

Zusammenfassung und weitere Schritte

Voraussetzungen

  • Grundkenntnisse von Maschinellem Lernen, wie überwachtes und unüberwachtes Lernen
  • Vertrautheit mit Python-Programmierung (Variablen, Schleifen, Funktionen)
  • Erfahrung mit Datenverarbeitung unter Verwendung von Bibliotheken wie pandas oder NumPy ist hilfreich, aber nicht erforderlich
  • Keine vorherige Erfahrung mit fortgeschrittenen Modellierungen oder Neuronalen Netzen erwartet

Zielgruppe

  • Data Scientists
  • Business Analysts
  • Softwareentwickler und technische Fachkräfte, die mit Daten arbeiten
 28 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (2)

Kommende Kurse

Verwandte Kategorien