Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Einführung in Reinforcement Learning
- Überblick über das Verstärkungslernen und seine Anwendungen
- Unterschiede zwischen überwachtem, unüberwachtem und verstärkendem Lernen
- Schlüsselkonzepte: Agent, Umgebung, Belohnungen und Politik
Markov-Entscheidungsprozesse (MDPs)
- Verstehen von Zuständen, Aktionen, Belohnungen und Zustandsübergängen
- Wertfunktionen und die Bellman-Gleichung
- Dynamische Programmierung zum Lösen von MDPs
Kern-RL-Algorithmen
- Tabellarische Methoden: Q-Learning und SARSA
- Politik-basierte Methoden: REINFORCE-Algorithmus
- Actor-Critic Frameworks und ihre Anwendungen
Tief Reinforcement Learning
- Einführung in Deep Q-Networks (DQN)
- Erfahrungswiedergabe und Zielnetzwerke
- Policy-Gradienten und fortgeschrittene tiefe RL-Methoden
RL-Frameworks und Tools
- Einführung in OpenAI Gym und andere RL-Umgebungen
- Verwendung von PyTorch oder TensorFlow für die Entwicklung von RL-Modellen
- Training, Test und Benchmarking von RL-Agenten
Herausforderungen in RL
- Gleichgewicht zwischen Erkundung und Ausbeutung beim Training
- Umgang mit spärlichen Belohnungen und Kreditvergabeproblemen
- Scalability und rechnerische Herausforderungen in RL
Praktische Übungen Activities
- Implementierung von Q-Learning und SARSA-Algorithmen von Grund auf
- Training eines DQN-basierten Agenten, um ein einfaches Spiel in OpenAIGym zu spielen
- Feinabstimmung von RL-Modellen zur Verbesserung der Leistung in benutzerdefinierten Umgebungen
Zusammenfassung und nächste Schritte
Voraussetzungen
- Ausgeprägtes Verständnis der Grundsätze und Algorithmen des maschinellen Lernens
- Beherrschung der Python-Programmierung
- Vertrautheit mit neuronalen Netzen und Deep-Learning-Frameworks
Zielgruppe
- Ingenieure für maschinelles Lernen
- KI-Spezialisten
14 Stunden
Erfahrungsberichte (1)
Trainer beantwortet Fragen spontan.
Adrian
Kurs - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Maschinelle Übersetzung