Schulungsübersicht
Einführung in das maschinelle Lernen
- Arten des maschinellen Lernens – überwacht vs. nicht überwacht
- Von der statistischen Lernmethode zum maschinellen Lernen
- Der Data-Mining-Arbeitsablauf: Geschäftsverständnis, Datenbereitstellung, Modellierung, Bereitstellung
- Wahl des richtigen Algorithmus für die Aufgabe
- Überanpassung und der Bias-Variance-Tradeoff
Überblick über Python und ML-Bibliotheken
- Warum Programmiersprachen für das maschinelle Lernen verwendet werden
- Wahl zwischen R und Python
- Einführung in Python und Jupyter-Notebooks
- Python-Bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testen und Evaluieren von ML-Algorithmen
- Generalisierung, Überanpassung und Modellvalidierung
- Evaluierungsstrategien: Holdout, Kreuzvalidierung, Bootstrapping
- Metriken für die Regression: ME, MSE, RMSE, MAPE
- Metriken für Klassifikation: Genauigkeit, Verwirrungsmatrix, unbalancierte Klassen
- Modellleistung visualisieren: Profitkurve, ROC-Kurve, Lift-Kurve
- Modellauswahl und Grid-Search für die Optimierung
Datenbereitstellung
- Datenimport und -speicherung in Python
- Explorative Analyse und Zusammenfassungsstatistiken
- Behandlung fehlender Werte und Ausreißer
- Standardisierung, Normalisierung und Transformation
- Umwandlung qualitativer Daten und Datenverarbeitung mit pandas
Klassifikationsalgorithmen
- Binäre vs. multiklassen-Klassifikation
- Logistische Regression und Diskriminanzfunktionen
- Naive Bayes, k-nearest neighbors
- Entscheidungsbaumverfahren: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines und Kerne
- Ensemble-Lernmethoden
Regression und numerische Vorhersage
- Methode der kleinsten Quadrate und Variablenselektion
- Regularisierungsmethoden: L1, L2
- Polynomielle Regression und nichtlineare Modelle
- Regressionsbäume und Splines
Neuronale Netze
- Einführung in neuronale Netze und Deep Learning
- Aktivierungsfunktionen, Schichten und Backpropagation
- Multilayer Perceptrons (MLP)
- Verwendung von TensorFlow oder PyTorch für grundlegende neuronale Netzwerkbildung
- Neuronale Netze für Klassifikation und Regression
Umsatzprognose und prädiktive Analyse
- Zeitreihenanalyse vs. regressionsbasierte Prognose
- Verarbeitung saisonaler und trendbasierter Daten
- Erstellung eines Umsatzprognosemodells mit ML-Techniken
- Bewertung der Prognosegenauigkeit und Unsicherheit
- Geschäftliche Interpretation und Kommunikation der Ergebnisse
Unüberwachtes Lernen
- Clustering-Techniken: k-means, k-medoids, hierarchisches Clustering, SOMs
- Dimensionsreduktion: PCA, Faktorenanalyse, SVD
- Multidimensionale Skalierung
Textmining
- Textvorverarbeitung und Tokenisierung
- Bag-of-Words, Stammformbildung (Stemming) und Lemmatisierung
- Sentimentanalyse und Wortfrequenz
- Visualisierung von Textdaten mit Word Clouds
Empfehlungssysteme
- User-based und item-based Collaborative Filtering
- Entwicklung und Evaluierung von Empfehlungs-Engines
Assoziationsmustermining
- Häufige Itemsets und Apriori-Algorithmus
- Market Basket Analysis und Lift Ratio
Outlier-Detektion
- Analyse extrem hoher Werte
- Distanz- und Dichte-basierte Methoden
- Outlier-Detektion in hochdimensionalen Daten
Maschinelles Lernen Case Study
- Verständnis des Geschäftsproblems
- Datenvorverarbeitung und Feature Engineering
- Modellauswahl und Parameteroptimierung
- Evaluierung und Präsentation der Ergebnisse
- Bereitstellung
Zusammenfassung und weitere Schritte
Voraussetzungen
- Grundkenntnisse von Maschinellem Lernen, wie überwachtes und unüberwachtes Lernen
- Vertrautheit mit Python-Programmierung (Variablen, Schleifen, Funktionen)
- Erfahrung mit Datenverarbeitung unter Verwendung von Bibliotheken wie pandas oder NumPy ist hilfreich, aber nicht erforderlich
- Keine vorherige Erfahrung mit fortgeschrittenen Modellierungen oder Neuronalen Netzen erwartet
Zielgruppe
- Data Scientists
- Business Analysts
- Softwareentwickler und technische Fachkräfte, die mit Daten arbeiten
Erfahrungsberichte (2)
das ML-Ökosystem nicht nur MLflow, sondern auch Optuna, Hyperopt, Docker und Docker Compose
Guillaume GAUTIER - OLEA MEDICAL
Kurs - MLflow
Maschinelle Übersetzung
Ich habe es genossen, an der Kubeflow-Schulung teilzunehmen, die fernmündlich durchgeführt wurde. Diese Schulung ermöglichte mir, mein Wissen zu AWS-Diensten, K8s und allen devOps-Tools um Kubeflow herum zu vertiefen, was die notwendigen Grundlagen sind, um das Thema angemessen anzugehen. Ich möchte mich bei Malawski Marcin für seine Geduld und Professionalität bei der Schulung sowie für seine Ratschläge zur Best Practice bedanken. Malawski behandelt das Thema aus verschiedenen Perspektiven und nutzt verschiedene Bereitstellungstools wie Ansible, EKS kubectl und Terraform. Nun bin ich definitiv davon überzeugt, dass ich mich in dem richtigen Anwendungsbereich befinde.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Kurs - Kubeflow
Maschinelle Übersetzung