Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Entwurf einer offenen AIOps-Architektur
- Überblick über die wesentlichen Komponenten in offenen AIOps-Pipelines
- Datenfluss von der Erfassung bis zur Warnmeldung
- Werkzeugvergleich und Integrationsstrategie
Datenerfassung und -aggregation
- Erfassen zeitlicher Daten mit Prometheus
- Erfassen von Protokollen mit Logstash und Beats
- Normalisierung der Daten für die Quervergleichung
Erstellen von Observability-Dashboards
- Visualisieren von Metriken mit Grafana
- Erstellen von Kibana-Dashboards für Log-Analysen
- Verwenden von Elasticsearch-Abfragen zur Extraktion operativer Einsichten
Anomalieerkennung und Vorhersage von Ereignissen
- Exportieren der Observability-Daten in Python-Pipelines
- Training von ML-Modellen zur Ausreißererkennung und -Vorhersage
- Bereitstellen von Modellen für die Echtzeit-Inferenz in der Observability-Pipeline
Warnmeldungen und Automatisierung mit offenen Werkzeugen
- Erstellen von Prometheus-Warnregeln und Routing durch Alertmanager
- Auslösen von Skripten oder API-Workflows für die automatische Reaktion
- Verwenden von offenen Orchestrierungstools (z. B., Ansible, Rundeck)
Überlegungen zur Integration und Skalierung
- Umgang mit Hochvolumeneingaben und Langzeitretention
- Sicherheit und Zugriffskontrolle in Open-Source-Stacks
- Skalierung jeder Schicht unabhängig voneinander: Erfassung, Verarbeitung, Warnmeldungen
Reale Anwendungen und Erweiterungen
- Fallstudien: Leistungsoptimierung, Downtime-Vorbeugung und Kostenoptimierung
- Erweitern von Pipelines mit Tracing-Tools oder Dienstgraphen
- Best Practices für das Betreiben und Warten von AIOps in der Produktion
Zusammenfassung und nächste Schritte
Voraussetzungen
- Erfahrung mit Beobachtungstools wie Prometheus oder ELK
- Grundlegendes Wissen über Python und Maschinelles Lernen
- Verständnis von IT-Operationen und Warnungsworkflows
Zielgruppe
- Fortgeschrittene Site Reliability Engineers (SREs)
- Dateningenieure in der Operationsabteilung
- DevOps Plattenvorsitzende und Infrastrukturarchitekten
14 Stunden