Schulungsübersicht
Einführung in Reinforcement Learning und Agenty AI
- Entscheidungsfindung unter Unsicherheit und sequenzielle Planung
- Schlüsselkomponenten des RL: Agenten, Umgebungen, Zustände und Belohnungen
- Rolle des RL in adaptiven und agentigen AI-Systemen
Markov-Entscheidungsprozesse (MDPs)
- Formale Definition und Eigenschaften von MDPs
- Wertfunktionen, Bellman-Gleichungen und dynamische Programmierung
- Policy-Evaluation, -Verbesserung und -Iteration
Modellfreies Reinforcement Learning
- Monte Carlo- und Temporal-Difference (TD)-Lernen
- Q-Lernen und SARSA
- Praktische Übung: Implementierung von tabellarischen RL-Methoden in Python
Tiefes Reinforcement Learning
- Kombination von neuronalen Netzen mit RL zur Funktionsapproximation
- Deep Q-Networks (DQN) und Erfahrungswiedergabe
- Actor-Critic-Architekturen und Policy-Gradients
- Praktische Übung: Training eines Agenten mit DQN und PPO unter Verwendung von Stable-Baselines3
Explorationsstrategien und Reward-Shaping
- Balancing Exploration vs. Exploitation (ε-greedy, UCB, Entropie-Methoden)
- Design von Belohnungsfunktionen und Vermeidung ungewollten Verhaltens
- Reward-Shaping und Curriculum-Lernen
Fortgeschrittene Themen im RL und Entscheidungsfinden
- Multi-Agent-Reinforcement Learning und kooperative Strategien
- Hierarchisches Reinforcement Learning und Optionsframework
- Offline RL und Imitationslernen für sicherere Implementierung
Simulationsumgebungen und Evaluation
- Verwendung von OpenAI Gym und benutzerdefinierten Umgebungen
- Kontinuierliche vs. diskrete Aktionenräume
- Metriken für Agentenleistung, Stabilität und Sample-Effizienz
Integration von RL in Agenty AI-Systeme
- Kombination von Reasoning und RL in hybriden Agentenarchitekturen
- Integration des reinforcement learnings mit toolverwendenden Agenten
- Betriebsbedingungen für Skalierung und Implementierung
Abschlussprojekt
- Design und Implementierung eines reinforcement learning-Agents für eine simulierte Aufgabe
- Analyse der Trainingsleistung und Optimierung von Hyperparametern
- Demonstration adaptiven Verhaltens und Entscheidungsfindung in einem agentigen Kontext
Zusammenfassung und nächste Schritte
Voraussetzungen
- Solide Kenntnisse in Python-Programmierung
- Fundierte Kenntnisse der Konzepte des maschinellen Lernens und Deep Learnings
- Vertrautheit mit linearer Algebra, Wahrscheinlichkeitsrechnung und grundlegenden Optimierungsverfahren
Zielgruppe
- Reinforcement-Learning-Ingenieure und angewandte AI-Forscher
- Entwickler für Robotik und Automatisierung
- Ingenieurteams, die an adaptiven und agentigen AI-Systemen arbeiten
Erfahrungsberichte (3)
Guter Mix aus Wissen und Praxis
Ion Mironescu - Facultatea S.A.I.A.P.M.
Kurs - Agentic AI for Enterprise Applications
Maschinelle Übersetzung
Die Mischung aus Theorie und Praxis sowie hoch- und niedrigstufigen Perspektiven
Ion Mironescu - Facultatea S.A.I.A.P.M.
Kurs - Autonomous Decision-Making with Agentic AI
Maschinelle Übersetzung
praktische Übungen
Daniel - Facultatea S.A.I.A.P.M.
Kurs - Agentic AI in Multi-Agent Systems
Maschinelle Übersetzung