Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Einführung in AIOps
- Was ist AIOps und warum es wichtig ist
- Traditionelles Monitoring vs. AIOps-gesteuerte Observability
- AIOps-Architektur und Kernkomponenten
Erfassung und Normalisierung von Betriebsdaten
- Arten von Observability-Daten: Metriken, Logs und Traces
- Daten aus mehreren Quellen (Server, Container, Cloud) aufnehmen
- Einsatz von Agents und Exportern (Prometheus, Beats, Fluentd)
Datenkorrelation und Anomalieerkennung
- Korrelation von Zeitreihen und statistische Methoden
- Einsatz von ML-Modellen zur Anomalieerkennung
- Erkennung von Vorfällen in verteilten Systemen
Alerting und Rauschreduzierung
- Konfiguration intelligenter Alert-Regeln und Schwellenwerte
- Unterdrückung, Deduplizierung und Bündelung von Alerts
- Integration mit Alertmanager, Slack, PagerDuty oder Opsgenie
Root-Cause-Analyse und Visualisierung
- Nutzung von Dashboards zur Visualisierung von Metriken und Erkennung von Trends
- Untersuchung von Ereignissen und Zeitstrählen für die RCA
- Verfolgung von Problemen über Schichten hinweg mit Tools für Distributed Tracing
Automatisierung und Remediation
- Auslösen automatisierter Skripte oder Workflows bei Vorfällen
- Integration in ITSM-Systeme (ServiceNow, Jira)
- Use Cases: Self-Healing, Skalierung, Traffic-Umleitung
Open-Source- und kommerzielle AIOps-Plattformen
- Überblick über Tools: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Bewertungskriterien zur Auswahl einer AIOps-Plattform
- Demo und praktische Übung mit einem ausgewählten Stack
Zusammenfassung und nächste Schritte
Voraussetzungen
- Grundkenntnisse in IT-Betriebsabläufen und Konzepten des System-Monitorings
- Erfahrung mit Monitoring-Tools oder Dashboards
- Vertrautheit mit grundlegenden Log- und Metrikformaten
Zielgruppe
- Betriebsteams, die für Infrastruktur und Anwendungen zuständig sind
- Site Reliability Engineers (SREs)
- IT-Teams für Monitoring und Observability
14 Stunden