Apache Airflow for Data Science: Automating Machine Learning Pipelines Schulung
Apache Airflow ist eine Open-Source-Plattform für die Orchestrierung von Arbeitsabläufen und die Automatisierung komplexer Datenpipelines.
Diese von einem Trainer geleitete Live-Schulung (online oder vor Ort) richtet sich an fortgeschrittene Teilnehmer, die Workflows für maschinelles Lernen, einschließlich Modelltraining, Validierung und Bereitstellung, mit Apache Airflow automatisieren und verwalten möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Apache Airflow für die Orchestrierung von Workflows für maschinelles Lernen einzurichten.
- Datenvorverarbeitung, Modelltraining und Validierungsaufgaben zu automatisieren.
- Airflow mit Frameworks und Tools für maschinelles Lernen zu integrieren.
- Einsatz von Machine-Learning-Modellen mithilfe automatisierter Pipelines.
- Überwachung und Optimierung von Workflows für maschinelles Lernen in der Produktion.
Format des Kurses
- Interaktive Vorlesung und Diskussion.
- Viele Übungen und Praxis.
- Praktische Umsetzung in einer Live-Laborumgebung.
Optionen zur Kursanpassung
- Wenn Sie eine maßgeschneiderte Schulung für diesen Kurs wünschen, nehmen Sie bitte Kontakt mit uns auf, um dies zu vereinbaren.
Schulungsübersicht
Einführung in Apache Airflow für Machine Learning
- Überblick über Apache Airflow und seine Bedeutung für die Datenwissenschaft
- Schlüsselfunktionen für die Automatisierung von Arbeitsabläufen des maschinellen Lernens
- Einrichten von Airflow für datenwissenschaftliche Projekte
Aufbau von Machine Learning Pipelines mit Airflow
- Entwurf von DAGs für durchgängige ML-Workflows
- Verwendung von Operatoren für Dateneingabe, Vorverarbeitung und Feature Engineering
- Planen und Verwalten von Pipeline-Abhängigkeiten
Modelltraining und Validierung
- Automatisieren von Modelltrainingsaufgaben mit Airflow
- Integration von Airflow mit ML-Frameworks (z. B. TensorFlow, PyTorch)
- Validierung von Modellen und Speicherung von Bewertungsmetriken
Modellbereitstellung und Überwachung
- Einsatz von Modellen für maschinelles Lernen mit automatisierten Pipelines
- Überwachung eingesetzter Modelle mit Airflow-Aufgaben
- Handhabung von Umschulungen und Modellaktualisierungen
Erweiterte Anpassung und Integration
- Entwicklung von benutzerdefinierten Operatoren für ML-spezifische Aufgaben
- Integration von Airflow mit Cloud-Plattformen und ML-Diensten
- Erweitern von Airflow-Workflows mit Plugins und Sensoren
Optimieren und Skalieren von ML-Pipelines
- Verbesserung der Workflow-Leistung für große Datenmengen
- Skalierung von Airflow-Einsätzen mit Celery und Kubernetes
- Bewährte Praktiken für ML-Workflows in Produktionsqualität
Fallstudien und praktische Anwendungen
- Beispiele aus der Praxis für ML-Automatisierung mit Airflow
- Praktische Übung: Aufbau einer End-to-End-ML-Pipeline
- Diskussion von Herausforderungen und Lösungen im ML-Workflow-Management
Zusammenfassung und nächste Schritte
Voraussetzungen
- Vertrautheit mit Arbeitsabläufen und Konzepten des maschinellen Lernens
- Grundlegendes Verständnis von Apache Airflow, einschließlich DAGs und Operatoren
- Beherrschung der Python-Programmierung
Zielgruppe
- Datenwissenschaftler
- Ingenieure für maschinelles Lernen
- KI-Entwickler
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.
Apache Airflow for Data Science: Automating Machine Learning Pipelines Schulung - Booking
Apache Airflow for Data Science: Automating Machine Learning Pipelines Schulung - Enquiry
Kommende Kurse
Kombinierte Kurse
AdaBoost Python for Machine Learning
14 StundenDiese von einem Trainer geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler und Software-Ingenieure, die AdaBoost verwenden möchten, um Boosting-Algorithmen für maschinelles Lernen mit Python zu erstellen.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- die notwendige Entwicklungsumgebung einzurichten, um mit der Erstellung von Modellen für maschinelles Lernen mit AdaBoost zu beginnen.
- den Ensemble-Learning-Ansatz und die Implementierung von adaptivem Boosting zu verstehen.
- Lernen, wie man AdaBoost-Modelle erstellt, um maschinelle Lernalgorithmen in Python zu verstärken.
- Hyperparameter-Tuning zu verwenden, um die Genauigkeit und Leistung von AdaBoost-Modellen zu erhöhen.
Anaconda Ecosystem for Data Scientists
14 StundenDiese von einem Dozenten geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler, die das Anaconda-Ökosystem zur Erfassung, Verwaltung und Bereitstellung von Paketen und Datenanalyse-Workflows auf einer einzigen Plattform nutzen möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- Anaconda-Komponenten und -Bibliotheken zu installieren und zu konfigurieren.
- Die Kernkonzepte, Funktionen und Vorteile von Anaconda zu verstehen.
- Pakete, Umgebungen und Kanäle mit Anaconda Navigator zu verwalten.
- Conda, R und Python Pakete für Data Science und maschinelles Lernen verwenden.
- Sie lernen einige praktische Anwendungsfälle und Techniken für die Verwaltung mehrerer Datenumgebungen kennen.
AutoML with Auto-Keras
14 StundenDiese von einem Dozenten geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler und technisch weniger versierte Personen, die Auto-Keras verwenden möchten, um den Prozess der Auswahl und Optimierung eines maschinellen Lernmodells zu automatisieren.
Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:
- den Prozess des Trainings von hocheffizienten maschinellen Lernmodellen zu automatisieren.
- Automatisch nach den besten Parametern für Deep-Learning-Modelle zu suchen.
- Hochpräzise Modelle für maschinelles Lernen zu erstellen.
- die Möglichkeiten des maschinellen Lernens für die Lösung realer Geschäftsprobleme zu nutzen.
AutoML
14 StundenDiese von einem Ausbilder geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an technische Personen mit Hintergrundwissen im Bereich des maschinellen Lernens, die die zur Erkennung komplexer Muster in Big Data verwendeten maschinellen Lernmodelle optimieren möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- Verschiedene Open-Source-Tools AutoML zu installieren und zu evaluieren (H2O AutoML, auto-sklearn, TPOT, TensorFlow, PyTorch, Auto-Keras, TPOT, Auto-WEKA, usw.)
- Trainieren Sie qualitativ hochwertige Modelle für maschinelles Lernen.
- Effiziente Lösung verschiedener Arten von überwachten maschinellen Lernproblemen.
- Schreiben Sie nur den notwendigen Code, um den automatisierten maschinellen Lernprozess in Gang zu setzen.
Creating Custom Chatbots with Google AutoML
14 StundenDiese von einem Trainer geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Teilnehmer mit unterschiedlichem Kenntnisstand, die die Google AutoML-Plattform nutzen möchten, um individuelle Chatbots für verschiedene Anwendungen zu erstellen.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Die Grundlagen der Chatbot-Entwicklung zu verstehen.
- Die Google Cloud-Plattform zu navigieren und auf AutoML zuzugreifen.
- Daten für das Training von Chatbot-Modellen vorzubereiten.
- Benutzerdefinierte Chatbot-Modelle mit AutoML zu trainieren und zu bewerten.
- Einsatz und Integration von Chatbots in verschiedene Plattformen und Kanäle.
- Überwachen und optimieren Sie die Chatbot-Leistung im Laufe der Zeit.
DataRobot
7 StundenDiese von einem Trainer geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler und Datenanalysten, die Vorhersagemodelle mit den Funktionen des maschinellen Lernens von DataRobot automatisieren, bewerten und verwalten möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- Datensätze in DataRobot zu laden, um Daten zu analysieren, zu bewerten und ihre Qualität zu prüfen.
- Modelle erstellen und trainieren, um wichtige Variablen zu identifizieren und Vorhersageziele zu erreichen.
- Modelle zu interpretieren, um wertvolle Erkenntnisse zu gewinnen, die für Geschäftsentscheidungen nützlich sind.
- Modelle zu überwachen und zu verwalten, um eine optimierte Vorhersageleistung zu erhalten.
Data Mining with Weka
14 StundenDiese Live-Schulung in Österreich (online oder vor Ort) richtet sich an Anfänger und fortgeschrittene Datenanalysten und Datenwissenschaftler, die Weka zur Durchführung von Data-Mining-Aufgaben verwenden möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- Weka zu installieren und zu konfigurieren.
- Die Weka-Umgebung und -Workbench zu verstehen.
- Data-Mining-Aufgaben mit Weka durchzuführen.
Google Cloud AutoML
7 StundenDiese von einem Trainer geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler, Datenanalysten und Entwickler, die die Produkte und Funktionen von AutoML kennenlernen möchten, um benutzerdefinierte ML-Schulungsmodelle mit minimalem Aufwand zu erstellen und einzusetzen.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Die AutoML-Produktlinie zu erkunden, um verschiedene Dienste für unterschiedliche Datentypen zu implementieren.
- Datensätze vorbereiten und beschriften, um benutzerdefinierte ML-Modelle zu erstellen.
- Modelle zu trainieren und zu verwalten, um genaue und faire maschinelle Lernmodelle zu erstellen.
- Vorhersagen mit trainierten Modellen treffen, um Geschäftsziele und -anforderungen zu erfüllen.
Kaggle
14 StundenDiese von einem Dozenten geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler und -entwickler, die Data Science mit Kaggle erlernen und ihre Karriere ausbauen möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Über Datenwissenschaft und maschinelles Lernen lernen.
- Datenanalytik erforschen.
- Lernen Sie über Kaggle und wie es funktioniert.
Machine Learning for Mobile Apps using Google’s ML Kit
14 StundenDiese von einem Trainer geleitete Live-Schulung (online oder vor Ort) richtet sich an Entwickler, die mit Google's ML Kit maschinelle Lernmodelle erstellen möchten, die für die Verarbeitung auf mobilen Geräten optimiert sind.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- die notwendige Entwicklungsumgebung einzurichten, um mit der Entwicklung von maschinellen Lernfunktionen für mobile Anwendungen zu beginnen.
- Neue Technologien des maschinellen Lernens mit Hilfe der ML Kit APIs in Android und iOS Apps zu integrieren.
- Bestehende Apps mit dem ML Kit SDK für die Verarbeitung und Bereitstellung auf dem Gerät zu erweitern und zu optimieren.
Accelerating Python Pandas Workflows with Modin
14 StundenDiese von einem Trainer geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler und Entwickler, die Modin verwenden möchten, um parallele Berechnungen mit Pandas für eine schnellere Datenanalyse zu erstellen und zu implementieren.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- die notwendige Umgebung einzurichten, um mit der Entwicklung von Pandas-Workflows in großem Maßstab mit Modin zu beginnen.
- die Funktionen, die Architektur und die Vorteile von Modin zu verstehen.
- Die Unterschiede zwischen Modin, Dask und Ray kennen.
- Schnellere Durchführung von Pandas-Vorgängen mit Modin.
- Implementierung der gesamten Pandas API und Funktionen.
Machine Learning with Random Forest
14 StundenDiese von einem Dozenten geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler und Software-Ingenieure, die Random Forest verwenden möchten, um Algorithmen für maschinelles Lernen für große Datensätze zu erstellen.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- die notwendige Entwicklungsumgebung einzurichten, um mit der Erstellung von maschinellen Lernmodellen mit Random Forest zu beginnen.
- die Vorteile von Random Forest zu verstehen und zu wissen, wie man es zur Lösung von Klassifikations- und Regressionsproblemen einsetzt.
- Lernen, wie man mit großen Datensätzen umgeht und mehrere Entscheidungsbäume in Random Forest interpretiert.
- Evaluierung und Optimierung der Leistung von Machine-Learning-Modellen durch Abstimmung der Hyperparameter.
Advanced Analytics with RapidMiner
14 StundenDiese von einem Ausbilder geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an fortgeschrittene Datenanalysten, die lernen möchten, wie man RapidMiner verwendet, um Werte zu schätzen und zu projizieren und Analysewerkzeuge für Zeitreihenprognosen zu nutzen.
Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:
- die CRISP-DM-Methodik anzuwenden, geeignete Algorithmen für maschinelles Lernen auszuwählen und die Modellkonstruktion und -leistung zu verbessern.
- RapidMiner zu verwenden, um Werte zu schätzen und zu projizieren, und analytische Werkzeuge für Zeitreihenprognosen zu nutzen.
RapidMiner for Machine Learning and Predictive Analytics
14 StundenRapidMiner ist eine quelloffene Data-Science-Softwareplattform für Rapid Application Prototyping und Entwicklung. Sie umfasst eine integrierte Umgebung für Datenaufbereitung, maschinelles Lernen, Deep Learning, Text Mining und prädiktive Analysen.
In dieser von einem Trainer geleiteten Live-Schulung lernen die Teilnehmer, wie sie RapidMiner Studio für die Datenaufbereitung, das maschinelle Lernen und die Bereitstellung von Vorhersagemodellen nutzen können.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein
- Installieren und Konfigurieren von RapidMiner
- Daten mit RapidMiner aufbereiten und visualisieren
- Modelle für maschinelles Lernen zu validieren
- Daten zu mischen und Vorhersagemodelle zu erstellen
- Predictive Analytics innerhalb eines Geschäftsprozesses zu operationalisieren
- Fehlerbehebung und Optimierung RapidMiner
Zielgruppe
- Datenwissenschaftler
- Ingenieure
- Entwickler
Format des Kurses
- Teilweise Vorlesung, teilweise Diskussion, Übungen und umfangreiche praktische Übungen
Hinweis
- Wenn Sie eine maßgeschneiderte Schulung für diesen Kurs wünschen, nehmen Sie bitte Kontakt mit uns auf, um dies zu vereinbaren.
GPU Data Science with NVIDIA RAPIDS
14 StundenDiese von einem Dozenten geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler und Entwickler, die RAPIDS nutzen möchten, um GPU-beschleunigte Datenpipelines, Workflows und Visualisierungen zu erstellen und dabei Algorithmen des maschinellen Lernens wie XGBoost, cuML usw. anzuwenden.
Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:
- Einrichten der erforderlichen Entwicklungsumgebung zur Erstellung von Datenmodellen mit NVIDIA RAPIDS.
- Die Funktionen, Komponenten und Vorteile von RAPIDS zu verstehen.
- Nutzung von GPU zur Beschleunigung von End-to-End-Daten- und Analysepipelines.
- Implementierung von GPU-beschleunigter Datenvorbereitung und ETL mit cuDF und Apache Arrow.
- Lernen Sie, wie Sie maschinelle Lernaufgaben mit XGBoost- und cuML-Algorithmen durchführen können.
- Erstellen Sie Datenvisualisierungen und führen Sie Graphanalysen mit cuXfilter und cuGraph durch.