Schulungsübersicht

Einführung in Predictive AIOps

  • Überblick über prädiktive Analyse in IT-Operationen
  • Datensätze für Vorhersagen (Logs, Metriken, Ereignisse)
  • Schlüsselkonzepte der Zeitreihenvorhersage und Anomalie-Muster

Gestaltung von Vorhersagemodellen für Vorfälle

  • Historische Vorfälle und Systemverhalten kennzeichnen
  • Auswahl und Training von Modellen (z.B., LSTM, Random Forest, AutoML)
  • Bewertung der Modellleistung und die Behandlung von Falschpositiven

Datensammlung und Feature-Engineering

  • Aufnehmen und Ausrichten von Log-Daten und Metriken für das Modelleingang
  • Extrahierung von Merkmalen aus strukturierten und unstrukturierten Daten
  • Umgang mit Rauschen und fehlenden Daten in operativen Pipelines

Automatisierung der Ursachenanalyse (RCA)

  • Graphbasierte Korrelation von Diensten und Infrastruktur
  • Nutzung von ML, um wahrscheinliche Ursachen aus Ereignisketten abzuleiten
  • Visualisierung der RCA mit topologiebemessenen Dashboards

Sanierung und Workflow Automation

  • Integration in Automatisierungsplattformen (z.B., Ansible, Rundeck)
  • Auslösen von Rollbacks, Neustarts oder Verkehrsweiterleitung
  • Überprüfung und Dokumentation automatisierter Eingriffe

Skalierung intelligenter AIOps Pipelines

  • MLOps für Beobachtbarkeit: Neuführung und Modellversionierung
  • Ausführen von Vorhersagen in Echtzeit über verteilte Knoten
  • Beste Praktiken zur Bereitstellung von AIOps in Produktionsumgebungen

Fallstudien und Praktische Anwendungen

  • Analyse reeller Vorfalldaten unter Verwendung prädiktiver AIOps-Modelle
  • Bereitstellung von RCA-Pipelines mit synthetischer und Produktionsdaten
  • Übersicht über Branchen-Use-Cases: Cloud-Ausfälle, Mikroservices-Instabilität, Netzwerk-Degradationen

Zusammenfassung und Nächste Schritte

Voraussetzungen

  • Erfahrung mit Überwachungssystemen wie Prometheus oder ELK
  • Grundlegendes Verständnis von Python und maschinellem Lernen
  • Familiarität mit Workflows für die Vorfallverwaltung

Zielgruppe

  • Senior Site Reliability Engineers (SREs)
  • IT-Automatisierungsarchitekten
  • DevOps und Leiter von Observability-Plattformen
 14 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Kommende Kurse

Verwandte Kategorien