Kontakt aufnehmen

Schulungsübersicht

1. Einführung in Deep Reinforcement Learning

  • Was ist Reinforcement Learning?
  • Unterschiede zwischen überwachtem Lernen, unüberwachtem Lernen und Reinforcement Learning
  • Anwendungen von DRL im Jahr 2025 (Robotik, Gesundheitswesen, Finanzwesen, Logistik)
  • Verständnis der Interaktionsschleife zwischen Agent und Umgebung

2. Grundlagen des Reinforcement Learnings

  • Markov-Entscheidungsprozesse (MDP)
  • Zustand, Aktion, Belohnung, Richtlinie und Wertfunktionen
  • Der Trade-off zwischen Exploration und Exploitation
  • Monte-Carlo-Methoden und Temporal-Difference-(TD)-Lernen

3. Implementierung grundlegender RL-Algorithmen

  • Tabellarische Methoden: Dynamische Programmierung, Policy-Evaluation und Iteration
  • Q-Learning und SARSA
  • Epsilon-gierige Exploration und abklingende Strategien
  • Implementierung von RL-Umgebungen mit OpenAI Gymnasium

4. Übergang zu Deep Reinforcement Learning

  • Einschränkungen tabellarischer Methoden
  • Einsatz neuronaler Netze zur Funktionsannäherung
  • Architektur und Arbeitsablauf eines Deep Q-Network (DQN)
  • Experience Replay und Zielnetzwerke (Target Networks)

5. Fortgeschrittene DRL-Algorithmen

  • Double DQN, Dueling DQN und Prioritized Experience Replay
  • Policy Gradient Methods: REINFORCE-Algorithmus
  • Actor-Critic-Architekturen (A2C, A3C)
  • Proximal Policy Optimization (PPO)
  • Soft Actor-Critic (SAC)

6. Arbeit mit kontinuierlichen Aktionsräumen

  • Herausforderungen bei der kontinuierlichen Steuerung
  • Einsatz von DDPG (Deep Deterministic Policy Gradient)
  • Twin Delayed DDPG (TD3)

7. Praktische Tools und Frameworks

  • Einsatz von Stable-Baselines3 und Ray RLlib
  • Protokollierung und Überwachung mit TensorBoard
  • Hyperparameter-Tuning für DRL-Modelle

8. Reward Engineering und Umgebungsentwurf

  • Belohnungsformung und Ausgleich von Strafen
  • Konzepte des Transferlernings von Simulation in die Realität (Sim-to-Real)
  • Erstellung benutzerdefinierter Umgebungen in Gymnasium

9. Partielle beobachtbare Umgebungen und Generalisierung

  • Umgang mit unvollständigen Zustandsinformationen (POMDPs)
  • Gedächtnisbasierte Ansätze unter Verwendung von LSTMs und RNNs
  • Verbesserung der Robustheit und Generalisierungsfähigkeit des Agenten

10. Spieltheorie und Multi-Agent-Reinforcement-Learning

  • Einführung in Multi-Agent-Umgebungen
  • Kooperation versus Wettbewerb
  • Anwendungen im adversarialen Training und in der Strategieoptimierung

11. Fallstudien und reale Anwendungen

  • Simulationen autonomer Fahrzeuge
  • Dynamische Preisgestaltung und Finanzhandelsstrategien
  • Robotik und industrielle Automatisierung

12. Debugging und Optimierung

  • Diagnose von instabilem Training
  • Umgang mit spärlichen Belohnungen und Overfitting
  • Skalierung von DRL-Modellen auf GPUs und verteilten Systemen

13. Zusammenfassung und weitere Schritte

  • Wiederholung der DRL-Architektur und der wichtigsten Algorithmen
  • Branchentrends und Forschungsrichtungen (z. B. RLHF, hybride Modelle)
  • Weitere Ressourcen und Lesematerialien

Voraussetzungen

  • Fortgeschrittene Kenntnisse in Python-Programmierung
  • Verständnis von Analysis und Linear Algebra
  • Grundkenntnisse in Wahrscheinlichkeitsrechnung und Statistik
  • Erfahrung beim Aufbau von Machine-Learning-Modellen mit Python sowie NumPy oder TensorFlow/PyTorch

Zielgruppe

  • Entwickler, die sich für KI und intelligente Systeme interessieren
  • Data Scientists, die Frameworks für Reinforcement Learning erkunden
  • Machine-Learning-Ingenieure, die mit autonomen Systemen arbeiten
 21 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (3)

Kommende Kurse

Verwandte Kategorien