Schulungsübersicht
1. Einführung in Deep Reinforcement Learning
- Was ist Reinforcement Learning?
- Unterschiede zwischen überwachtem Lernen, unüberwachtem Lernen und Reinforcement Learning
- Anwendungen von DRL im Jahr 2025 (Robotik, Gesundheitswesen, Finanzwesen, Logistik)
- Verständnis der Interaktionsschleife zwischen Agent und Umgebung
2. Grundlagen des Reinforcement Learnings
- Markov-Entscheidungsprozesse (MDP)
- Zustand, Aktion, Belohnung, Richtlinie und Wertfunktionen
- Der Trade-off zwischen Exploration und Exploitation
- Monte-Carlo-Methoden und Temporal-Difference-(TD)-Lernen
3. Implementierung grundlegender RL-Algorithmen
- Tabellarische Methoden: Dynamische Programmierung, Policy-Evaluation und Iteration
- Q-Learning und SARSA
- Epsilon-gierige Exploration und abklingende Strategien
- Implementierung von RL-Umgebungen mit OpenAI Gymnasium
4. Übergang zu Deep Reinforcement Learning
- Einschränkungen tabellarischer Methoden
- Einsatz neuronaler Netze zur Funktionsannäherung
- Architektur und Arbeitsablauf eines Deep Q-Network (DQN)
- Experience Replay und Zielnetzwerke (Target Networks)
5. Fortgeschrittene DRL-Algorithmen
- Double DQN, Dueling DQN und Prioritized Experience Replay
- Policy Gradient Methods: REINFORCE-Algorithmus
- Actor-Critic-Architekturen (A2C, A3C)
- Proximal Policy Optimization (PPO)
- Soft Actor-Critic (SAC)
6. Arbeit mit kontinuierlichen Aktionsräumen
- Herausforderungen bei der kontinuierlichen Steuerung
- Einsatz von DDPG (Deep Deterministic Policy Gradient)
- Twin Delayed DDPG (TD3)
7. Praktische Tools und Frameworks
- Einsatz von Stable-Baselines3 und Ray RLlib
- Protokollierung und Überwachung mit TensorBoard
- Hyperparameter-Tuning für DRL-Modelle
8. Reward Engineering und Umgebungsentwurf
- Belohnungsformung und Ausgleich von Strafen
- Konzepte des Transferlernings von Simulation in die Realität (Sim-to-Real)
- Erstellung benutzerdefinierter Umgebungen in Gymnasium
9. Partielle beobachtbare Umgebungen und Generalisierung
- Umgang mit unvollständigen Zustandsinformationen (POMDPs)
- Gedächtnisbasierte Ansätze unter Verwendung von LSTMs und RNNs
- Verbesserung der Robustheit und Generalisierungsfähigkeit des Agenten
10. Spieltheorie und Multi-Agent-Reinforcement-Learning
- Einführung in Multi-Agent-Umgebungen
- Kooperation versus Wettbewerb
- Anwendungen im adversarialen Training und in der Strategieoptimierung
11. Fallstudien und reale Anwendungen
- Simulationen autonomer Fahrzeuge
- Dynamische Preisgestaltung und Finanzhandelsstrategien
- Robotik und industrielle Automatisierung
12. Debugging und Optimierung
- Diagnose von instabilem Training
- Umgang mit spärlichen Belohnungen und Overfitting
- Skalierung von DRL-Modellen auf GPUs und verteilten Systemen
13. Zusammenfassung und weitere Schritte
- Wiederholung der DRL-Architektur und der wichtigsten Algorithmen
- Branchentrends und Forschungsrichtungen (z. B. RLHF, hybride Modelle)
- Weitere Ressourcen und Lesematerialien
Voraussetzungen
- Fortgeschrittene Kenntnisse in Python-Programmierung
- Verständnis von Analysis und Linear Algebra
- Grundkenntnisse in Wahrscheinlichkeitsrechnung und Statistik
- Erfahrung beim Aufbau von Machine-Learning-Modellen mit Python sowie NumPy oder TensorFlow/PyTorch
Zielgruppe
- Entwickler, die sich für KI und intelligente Systeme interessieren
- Data Scientists, die Frameworks für Reinforcement Learning erkunden
- Machine-Learning-Ingenieure, die mit autonomen Systemen arbeiten
Erfahrungsberichte (3)
Mir hat besonders der Schluss gefallen, als wir die Zeit nahmen, mit CHAT GPT herumzuspielen. Der Raum war dafür jedoch nicht optimal eingerichtet – anstelle eines großen Tisches wären ein paar kleinere Tische nützlicher gewesen, damit wir in kleinen Gruppen zusammenkommen und brainstormen könnten.
Nola - Laramie County Community College
Kurs - Artificial Intelligence (AI) Overview
Maschinelle Übersetzung
Nach grundlegenden Prinzipien arbeiten und sich innerhalb desselben Tages auf die Anwendung von Fallstudien konzentrieren
Maggie Webb - Department of Jobs, Regions, and Precincts
Kurs - Artificial Neural Networks, Machine Learning, Deep Thinking
Maschinelle Übersetzung
Dass es reale Firmendaten verwendete. Der Trainer hatte einen sehr guten Ansatz, indem er die Teilnehmer aktiv einbezog und sie miteinander wetteifern ließ.
Jimena Esquivel - Zaklad Uslugowy Hakoman Andrzej Cybulski
Kurs - Applied AI from Scratch in Python
Maschinelle Übersetzung