Schulungsübersicht
Einführung in das maschinelle Lernen
- Arten des maschinellen Lernens – überwacht vs. nicht überwacht
- Von der statistischen Lernmethode zum maschinellen Lernen
- Der Data-Mining-Arbeitsablauf: Geschäftsverständnis, Datenbereitstellung, Modellierung, Bereitstellung
- Wahl des richtigen Algorithmus für die Aufgabe
- Überanpassung und der Bias-Variance-Tradeoff
Überblick über Python und ML-Bibliotheken
- Warum Programmiersprachen für das maschinelle Lernen verwendet werden
- Wahl zwischen R und Python
- Einführung in Python und Jupyter-Notebooks
- Python-Bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testen und Evaluieren von ML-Algorithmen
- Generalisierung, Überanpassung und Modellvalidierung
- Evaluierungsstrategien: Holdout, Kreuzvalidierung, Bootstrapping
- Metriken für die Regression: ME, MSE, RMSE, MAPE
- Metriken für Klassifikation: Genauigkeit, Verwirrungsmatrix, unbalancierte Klassen
- Modellleistung visualisieren: Profitkurve, ROC-Kurve, Lift-Kurve
- Modellauswahl und Grid-Search für die Optimierung
Datenbereitstellung
- Datenimport und -speicherung in Python
- Explorative Analyse und Zusammenfassungsstatistiken
- Behandlung fehlender Werte und Ausreißer
- Standardisierung, Normalisierung und Transformation
- Umwandlung qualitativer Daten und Datenverarbeitung mit pandas
Klassifikationsalgorithmen
- Binäre vs. multiklassen-Klassifikation
- Logistische Regression und Diskriminanzfunktionen
- Naive Bayes, k-nearest neighbors
- Entscheidungsbaumverfahren: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines und Kerne
- Ensemble-Lernmethoden
Regression und numerische Vorhersage
- Methode der kleinsten Quadrate und Variablenselektion
- Regularisierungsmethoden: L1, L2
- Polynomielle Regression und nichtlineare Modelle
- Regressionsbäume und Splines
Neuronale Netze
- Einführung in neuronale Netze und Deep Learning
- Aktivierungsfunktionen, Schichten und Backpropagation
- Multilayer Perceptrons (MLP)
- Verwendung von TensorFlow oder PyTorch für grundlegende neuronale Netzwerkbildung
- Neuronale Netze für Klassifikation und Regression
Umsatzprognose und prädiktive Analyse
- Zeitreihenanalyse vs. regressionsbasierte Prognose
- Verarbeitung saisonaler und trendbasierter Daten
- Erstellung eines Umsatzprognosemodells mit ML-Techniken
- Bewertung der Prognosegenauigkeit und Unsicherheit
- Geschäftliche Interpretation und Kommunikation der Ergebnisse
Unüberwachtes Lernen
- Clustering-Techniken: k-means, k-medoids, hierarchisches Clustering, SOMs
- Dimensionsreduktion: PCA, Faktorenanalyse, SVD
- Multidimensionale Skalierung
Textmining
- Textvorverarbeitung und Tokenisierung
- Bag-of-Words, Stammformbildung (Stemming) und Lemmatisierung
- Sentimentanalyse und Wortfrequenz
- Visualisierung von Textdaten mit Word Clouds
Empfehlungssysteme
- User-based und item-based Collaborative Filtering
- Entwicklung und Evaluierung von Empfehlungs-Engines
Assoziationsmustermining
- Häufige Itemsets und Apriori-Algorithmus
- Market Basket Analysis und Lift Ratio
Outlier-Detektion
- Analyse extrem hoher Werte
- Distanz- und Dichte-basierte Methoden
- Outlier-Detektion in hochdimensionalen Daten
Maschinelles Lernen Case Study
- Verständnis des Geschäftsproblems
- Datenvorverarbeitung und Feature Engineering
- Modellauswahl und Parameteroptimierung
- Evaluierung und Präsentation der Ergebnisse
- Bereitstellung
Zusammenfassung und weitere Schritte
Voraussetzungen
- Grundkenntnisse von Maschinellem Lernen, wie überwachtes und unüberwachtes Lernen
- Vertrautheit mit Python-Programmierung (Variablen, Schleifen, Funktionen)
- Erfahrung mit Datenverarbeitung unter Verwendung von Bibliotheken wie pandas oder NumPy ist hilfreich, aber nicht erforderlich
- Keine vorherige Erfahrung mit fortgeschrittenen Modellierungen oder Neuronalen Netzen erwartet
Zielgruppe
- Data Scientists
- Business Analysts
- Softwareentwickler und technische Fachkräfte, die mit Daten arbeiten
Erfahrungsberichte (2)
das ML-Ekosystem, nicht nur MLFlow sondern auch Optuna, Hyperopt, Docker und Docker-Compose
Guillaume GAUTIER - OLEA MEDICAL
Kurs - MLflow
Maschinelle Übersetzung
Ich habe es sehr genossen, an der Kubeflow Ausbildung teilzunehmen, die ferngesteuert durchgeführt wurde. Diese Ausbildung ermöglichte mir, mein Wissen zu AWS-Diensten, K8s und allen devOps-Tools rund um Kubeflow zu festigen, was die notwendige Grundlage ist, um das Thema angemessen anzugehen. Ich möchte Malawski Marcin für seine Geduld und Professionalität bei der Ausbildung sowie für Tipps zur besten Praxis danken. Malawski attackiert das Thema aus verschiedenen Perspektiven, mit unterschiedlichen Bereitstellungstools Ansible, EKS kubectl, Terraform. Jetzt bin ich definitiv überzeugt, dass ich mich auf dem richtigen Anwendungsgebiet befinde.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Kurs - Kubeflow
Maschinelle Übersetzung