Schulungsübersicht

Einführung in Reinforcement Learning und Agenty AI

  • Entscheidungsfindung unter Unsicherheit und sequenzielle Planung
  • Schlüsselkomponenten des RL: Agenten, Umgebungen, Zustände und Belohnungen
  • Rolle des RL in adaptiven und agentigen AI-Systemen

Markov-Entscheidungsprozesse (MDPs)

  • Formale Definition und Eigenschaften von MDPs
  • Wertfunktionen, Bellman-Gleichungen und dynamische Programmierung
  • Policy-Evaluation, -Verbesserung und -Iteration

Modellfreies Reinforcement Learning

  • Monte Carlo- und Temporal-Difference (TD)-Lernen
  • Q-Lernen und SARSA
  • Praktische Übung: Implementierung von tabellarischen RL-Methoden in Python

Tiefes Reinforcement Learning

  • Kombination von neuronalen Netzen mit RL zur Funktionsapproximation
  • Deep Q-Networks (DQN) und Erfahrungswiedergabe
  • Actor-Critic-Architekturen und Policy-Gradients
  • Praktische Übung: Training eines Agenten mit DQN und PPO unter Verwendung von Stable-Baselines3

Explorationsstrategien und Reward-Shaping

  • Balancing Exploration vs. Exploitation (ε-greedy, UCB, Entropie-Methoden)
  • Design von Belohnungsfunktionen und Vermeidung ungewollten Verhaltens
  • Reward-Shaping und Curriculum-Lernen

Fortgeschrittene Themen im RL und Entscheidungsfinden

  • Multi-Agent-Reinforcement Learning und kooperative Strategien
  • Hierarchisches Reinforcement Learning und Optionsframework
  • Offline RL und Imitationslernen für sicherere Implementierung

Simulationsumgebungen und Evaluation

  • Verwendung von OpenAI Gym und benutzerdefinierten Umgebungen
  • Kontinuierliche vs. diskrete Aktionenräume
  • Metriken für Agentenleistung, Stabilität und Sample-Effizienz

Integration von RL in Agenty AI-Systeme

  • Kombination von Reasoning und RL in hybriden Agentenarchitekturen
  • Integration des reinforcement learnings mit toolverwendenden Agenten
  • Betriebsbedingungen für Skalierung und Implementierung

Abschlussprojekt

  • Design und Implementierung eines reinforcement learning-Agents für eine simulierte Aufgabe
  • Analyse der Trainingsleistung und Optimierung von Hyperparametern
  • Demonstration adaptiven Verhaltens und Entscheidungsfindung in einem agentigen Kontext

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Solide Kenntnisse in Python-Programmierung
  • Fundierte Kenntnisse der Konzepte des maschinellen Lernens und Deep Learnings
  • Vertrautheit mit linearer Algebra, Wahrscheinlichkeitsrechnung und grundlegenden Optimierungsverfahren

Zielgruppe

  • Reinforcement-Learning-Ingenieure und angewandte AI-Forscher
  • Entwickler für Robotik und Automatisierung
  • Ingenieurteams, die an adaptiven und agentigen AI-Systemen arbeiten
 28 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (3)

Kommende Kurse

Verwandte Kategorien