Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Einführung in AIOps mit Open-Source-Tools
- Überblick über AIOps-Konzepte und Vorteile
- Prometheus und Grafana im Observability-Stack
- Die Rolle von ML in AIOps: prädiktive versus reaktive Analysen
Einrichtung von Prometheus und Grafana
- Installation und Konfiguration von Prometheus für die Sammlung von Zeitreihendaten
- Erstellung von Dashboards in Grafana mit Echtzeitmetriken
- Exploration von Exportern, Relabeling und Service Discovery
Datenvorverarbeitung für ML
- Extrahieren und Transformieren von Prometheus-Metriken
- Vorbereiten von Datensätzen für Anomalieerkennung und Prognose
- Verwendung der Transformatoren in Grafana oder Python-Pipelines
Anwendung von Machine Learning zur Anomalieerkennung
- Einfache ML-Modelle zur Erkennung von Ausreißern (z. B. Isolation Forest, One-Class SVM)
- Training und Bewertung der Modelle an Zeitreihendaten
- Visualisierung von Anomalien in Grafana-Dashboards
Prognose von Metriken mit ML
- Aufbau einfacher Prognosemodelle (Einführung in ARIMA, Prophet, LSTM)
- Vorhersage der Systemlast oder Ressourcennutzung
- Nutzung von Prognosen für frühzeitige Alarmierung und Skalierungsentscheidungen
Integration von ML mit Alarmierung und Automatisierung
- Definition von Alarmregeln basierend auf ML-Ausgaben oder Schwellenwerten
- Verwendung von Alertmanager und Benachrichtigungsrouting
- Auslösen von Skripten oder Automatisierungsworkflows bei Erkennung einer Anomalie
Skalierung und Operationalisierung von AIOps
- Integration externer Observability-Tools (z. B. ELK-Stack, Moogsoft, Dynatrace)
- Operationalisierung von ML-Modellen in Observability-Pipelines
- Best Practices für AIOps im großen Maßstab
Zusammenfassung und nächste Schritte
Voraussetzungen
- Verständnis von Konzepten zur Systemüberwachung und Observability
- Erfahrung im Umgang mit Grafana oder Prometheus
- Vertrautheit mit Python und Grundlagen des Machine Learnings
Zielgruppe
- Observability-Ingenieure
- Infrastruktur- und DevOps-Teams
- Architekten von Überwachungsplattformen und Site Reliability Engineers (SREs)
14 Stunden