Schulungsübersicht
Einführung in das maschinelle Lernen
- Arten des maschinellen Lernens – überwacht vs. unüberwacht
- Von statistischem Lernen zum maschinellen Lernen
- Der Workflow des Datenminings: Geschäftsverständnis, Datenvorbereitung, Modellierung, Bereitstellung
- Auswahl des richtigen Algorithmus für die Aufgabe
- Überanpassung und der Bias-Variance-Kompromiss
Übersicht über Python und ML-Bibliotheken
- Warum Programmiersprachen für das maschinelle Lernen verwendet werden
- Auswahl zwischen R und Python
- Schnellkurs in Python und Jupyter Notebooks
- Python-Bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testen und Evaluieren von ML-Algorithmen
- Verallgemeinerung, Überanpassung und Modellvalidierung
- Evaluationsstrategien: Holdout, Kreuzvalidierung, Bootstrapping
- Metriken für Regression: ME, MSE, RMSE, MAPE
- Metriken für Klassifizierung: Genauigkeit, Verwirrungsmatrix, unbalancierte Klassen
- Modellleistung visualisieren: Profitkurve, ROC-Kurve, Lift-Kurve
- Modellauswahl und Grid-Search zur Feinabstimmung
Datenvorbereitung
- Dateneinfuhr und -speicherung in Python
- Explorative Analyse und Zusammenfassungsstatistiken
- Bearbeitung fehlender Werte und Ausreißer
- Standardisierung, Normalisierung und Transformation
- Kodierung qualitativer Daten und Datenbearbeitung mit pandas
Klassifizierungs-Algorithmen
- Binäre vs. multiklassen Klassifizierung
- Logistische Regression und Diskriminanzfunktionen
- Naive Bayes, k-nächste Nachbarn
- Entscheidungsbaume: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines und Kerne
- Ensemble-Lernverfahren
Regression und numerische Vorhersage
- Kleinste Quadrate und Variablenselektion
- Regularisierungsmethoden: L1, L2
- Polyregression und nichtlineare Modelle
- Regessionstrees und Splines
Unüberwachtes Lernen
- Klusteranalysetechniken: k-means, k-medoids, hierarchische Clustering, SOMs
- Dimensionsreduktion: PCA, Faktorenanalyse, SVD
- Mehrdimensionale Skalierung
Textmining
- Vorverarbeitung von Text und Tokenisierung
- Bag-of-Words, Stammformbildung und Lemmatisierung
- Sentimentanalyse und Wortfrequenz
- Visualisierung von Textdaten mit Word Clouds
Empfehlungssysteme
- Nutzer- und elementbasierte kollaborative Filterung
- Entwurf und Evaluierung von Empfehlungsmotoren
Minen von Assoziationsmustern
- Häufige Itemsets und Apriori-Algorithmus
- Market Basket Analyse und Lift-Verhältnis
Auffälligkeitsdetektion
- Extreme-Wertanalyse
- Distanz- und dichteorientierte Methoden
- Auffälligkeitsdetektion in hochdimensionalen Daten
Fallstudie zum maschinellen Lernen
- Verstehen des Geschäftsproblems
- Datenvorbereitung und Feature Engineering
- Modellauswahl und Parametertuning
- Evaluierung und Präsentation der Ergebnisse
- Bereitstellung
Zusammenfassung und weitere Schritte
Voraussetzungen
- Grundverständnis von Statistik und linearer Algebra
- Bekanntschaft mit Datenanalyse oder Business-Intelligence-Konzepten
- Eine gewisse Erfahrung mit der Programmierung (vorzugsweise Python oder R) wird empfohlen
- Interesse am Lernen von angewandtem Maschinellem Lernen für datengestützte Projekte
Zielgruppe
- Datenanalysten und -wissenschaftler
- Statistiker und Forschungsfachleute
- Entwickler und IT-Professionals, die sich mit Maschinellem Lernen vertraut machen möchten
- Jeder, der an Datenwissenschaft oder prädiktiver Analyse beteiligt ist
Erfahrungsberichte (3)
Obwohl ich wegen Kundeterminen einen Tag verpasst habe, fühle ich mich nun viel klarer in den Prozessen und Techniken, die in Machine Learning verwendet werden, und weiß besser, wann ich eine Methode gegenüber einer anderen anwenden sollte. Unsere aktuelle Herausforderung ist es nun, das Gelernte zu üben und auf unser Problemfeld anzuwenden.
Richard Blewett - Rock Solid Knowledge Ltd
Kurs - Machine Learning – Data science
Maschinelle Übersetzung
Ich mag, dass die Ausbildung sich auf Beispiele und Programmierung konzentriert hat. Ich dachte, es wäre unmöglich, so viel Inhalte in drei Tage zu packen, aber ich hatte mich getäuscht. Die Ausbildung umfasste viele Themen und alles wurde sehr detailiert durchgeführt (insbesondere die Abstimmung der Modellparameter - ich hätte nicht gedacht, dass dafür Zeit sein würde, und war sehr überrascht).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kurs - Machine Learning – Data science
Maschinelle Übersetzung
Es zeigt viele Methoden mit vorbereiteten Skripten - sehr gut vorbereitete Materialien und einfach nachvollziehbar.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Kurs - Machine Learning – Data science
Maschinelle Übersetzung
 
                    