Kontakt aufnehmen

Schulungsübersicht

Einführung in AIOps mit Open-Source-Tools

  • Überblick über AIOps-Konzepte und Vorteile
  • Prometheus und Grafana im Observability-Stack
  • Die Rolle von ML in AIOps: prädiktive versus reaktive Analysen

Einrichtung von Prometheus und Grafana

  • Installation und Konfiguration von Prometheus für die Sammlung von Zeitreihendaten
  • Erstellung von Dashboards in Grafana mit Echtzeitmetriken
  • Exploration von Exportern, Relabeling und Service Discovery

Datenvorverarbeitung für ML

  • Extrahieren und Transformieren von Prometheus-Metriken
  • Vorbereiten von Datensätzen für Anomalieerkennung und Prognose
  • Verwendung der Transformatoren in Grafana oder Python-Pipelines

Anwendung von Machine Learning zur Anomalieerkennung

  • Einfache ML-Modelle zur Erkennung von Ausreißern (z. B. Isolation Forest, One-Class SVM)
  • Training und Bewertung der Modelle an Zeitreihendaten
  • Visualisierung von Anomalien in Grafana-Dashboards

Prognose von Metriken mit ML

  • Aufbau einfacher Prognosemodelle (Einführung in ARIMA, Prophet, LSTM)
  • Vorhersage der Systemlast oder Ressourcennutzung
  • Nutzung von Prognosen für frühzeitige Alarmierung und Skalierungsentscheidungen

Integration von ML mit Alarmierung und Automatisierung

  • Definition von Alarmregeln basierend auf ML-Ausgaben oder Schwellenwerten
  • Verwendung von Alertmanager und Benachrichtigungsrouting
  • Auslösen von Skripten oder Automatisierungsworkflows bei Erkennung einer Anomalie

Skalierung und Operationalisierung von AIOps

  • Integration externer Observability-Tools (z. B. ELK-Stack, Moogsoft, Dynatrace)
  • Operationalisierung von ML-Modellen in Observability-Pipelines
  • Best Practices für AIOps im großen Maßstab

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Verständnis von Konzepten zur Systemüberwachung und Observability
  • Erfahrung im Umgang mit Grafana oder Prometheus
  • Vertrautheit mit Python und Grundlagen des Machine Learnings

Zielgruppe

  • Observability-Ingenieure
  • Infrastruktur- und DevOps-Teams
  • Architekten von Überwachungsplattformen und Site Reliability Engineers (SREs)
 14 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Kommende Kurse

Verwandte Kategorien