Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Entwurf einer offenen AIOps-Architektur
- Überblick über die wichtigsten Komponenten in Open-AIOps-Pipelines
- Datenfluss von der Erfassung bis zum Alerting
- Toolvergleiche und Integrationsstrategie
Datenerfassung und -aggregation
- Erfassen von Zeitreihendaten mit Prometheus
- Sammeln von Logs mit Logstash und Beats
- Normalisieren der Daten zur quellenübergreifenden Korrelation
Aufbau von Observability-Dashboards
- Visualisierung von Metriken mit Grafana
- Erstellen von Kibana-Dashboards für Loganalysen
- Nutzen von Elasticsearch-Abfragen zur Extraktion operativer Erkenntnisse
Anomalieerkennung und Incident-Vorhersage
- Exportieren von Observability-Daten in Python-Pipelines
- Trainieren von ML-Modellen zur Outlier-Erkennung und Prognose
- Bereitstellen der Modelle für Echtzeit-Inferenz in der Observability-Pipeline
Alerting und Automatisierung mit Open-Source-Tools
- Erstellen von Prometheus-Alert-Regeln und Routing über Alertmanager
- Auslösen von Skripten oder API-Workflows für automatisierte Antworten
- Nutzen von Open-Source-Orchestrierungstools (z. B. Ansible, Rundeck)
Aspekte der Integration und Skalierbarkeit
- Umgang mit hoher Erfassungsvolumen und langfristiger Datenspeicherung
- Sicherheit und Zugriffskontrolle in Open-Source-Stacks
- Unabhängiges Skalieren jeder Schicht: Erfassung, Verarbeitung, Alerting
Anwendungsbeispiele und Erweiterungen aus der Praxis
- Fallstudien: Leistungs-tuning, Ausfallvermeidung und Kostenoptimierung
- Erweitern von Pipelines mit Tracing-Tools oder Service Graphs
- Best Practices für den Betrieb und die Wartung von AIOps in der Produktion
Zusammenfassung und weitere Schritte
Voraussetzungen
- Erfahrung mit Observability-Tools wie Prometheus oder ELK
- Gute Kenntnisse in Python und Grundlagen des Machine Learning
- Verständnis für IT-Betrieb und Alerting-Workflows
Zielgruppe
- Erfahrene Site Reliability Engineers (SREs)
- Data Engineers im Bereich IT-Betrieb
- Leitungspersonen für DevOps-Plattformen und Infrastrukturarbeiter:innen
14 Stunden