Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Einführung in Predictive AIOps
- Überblick über prädiktive Analyse in IT-Operationen
- Datensätze für Vorhersagen (Logs, Metriken, Ereignisse)
- Schlüsselkonzepte der Zeitreihenvorhersage und Anomalie-Muster
Gestaltung von Vorhersagemodellen für Vorfälle
- Historische Vorfälle und Systemverhalten kennzeichnen
- Auswahl und Training von Modellen (z.B., LSTM, Random Forest, AutoML)
- Bewertung der Modellleistung und die Behandlung von Falschpositiven
Datensammlung und Feature-Engineering
- Aufnehmen und Ausrichten von Log-Daten und Metriken für das Modelleingang
- Extrahierung von Merkmalen aus strukturierten und unstrukturierten Daten
- Umgang mit Rauschen und fehlenden Daten in operativen Pipelines
Automatisierung der Ursachenanalyse (RCA)
- Graphbasierte Korrelation von Diensten und Infrastruktur
- Nutzung von ML, um wahrscheinliche Ursachen aus Ereignisketten abzuleiten
- Visualisierung der RCA mit topologiebemessenen Dashboards
Sanierung und Workflow Automation
- Integration in Automatisierungsplattformen (z.B., Ansible, Rundeck)
- Auslösen von Rollbacks, Neustarts oder Verkehrsweiterleitung
- Überprüfung und Dokumentation automatisierter Eingriffe
Skalierung intelligenter AIOps Pipelines
- MLOps für Beobachtbarkeit: Neuführung und Modellversionierung
- Ausführen von Vorhersagen in Echtzeit über verteilte Knoten
- Beste Praktiken zur Bereitstellung von AIOps in Produktionsumgebungen
Fallstudien und Praktische Anwendungen
- Analyse reeller Vorfalldaten unter Verwendung prädiktiver AIOps-Modelle
- Bereitstellung von RCA-Pipelines mit synthetischer und Produktionsdaten
- Übersicht über Branchen-Use-Cases: Cloud-Ausfälle, Mikroservices-Instabilität, Netzwerk-Degradationen
Zusammenfassung und Nächste Schritte
Voraussetzungen
- Erfahrung mit Überwachungssystemen wie Prometheus oder ELK
- Grundlegendes Verständnis von Python und maschinellem Lernen
- Familiarität mit Workflows für die Vorfallverwaltung
Zielgruppe
- Senior Site Reliability Engineers (SREs)
- IT-Automatisierungsarchitekten
- DevOps und Leiter von Observability-Plattformen
14 Stunden