Schulungsübersicht
SRE-Antimuster
- Erkennen von kontraproduktiven Praktiken
- Einschätzung des Einflusses von Antimustern auf die Zuverlässigkeit
- Beste Praxis und korrigierende Alternativen
SLO als Proxy für Kundenzufriedenheit
- Definieren von Service Level Indicators (SLIs) und Service Level Objectives (SLOs)
- Führung von Fehlerbudgets und Balance zwischen Innovation und Zuverlässigkeit
- Vermitteln der Grenzen verteilter Systeme
Sicherheit und Zuverlässigkeit in Systemen aufbauen
- Design für Ausfalltoleranz und -Resilienz
- Integrieren von Sicherheit in die Zuverlässigkeitsingenieurung
- Skalierbarkeit und Strategien zur DatenSchutz
Ganzzustandsbeobachtbarkeit
- Instrumentierung und Metrik Erfassung
- Verteilte Spurung und synthetische Überwachung
- Beobachtbarkeit-getriebene Entwicklung
Platform Engineering und AIOps
- Plattformzentrierte Ingenieuransätze
- Automatisierung und Orchestrierung in SRE
- Nutzung von DataOps und operationaler Intelligenz
Vorfall Management im SRE-Umfeld
- Rollen und Verantwortlichkeiten bei der Vorfallreaktion
- Anwendung von Frameworks wie OODA
- Automatisierte Beseitigung und AI/ML-basierte Lösungen
Chaos Engineering
- Prinzipien und Strategien für Resilienztesten
- Planung und Durchführung von “Spieltag”-Übungen
- Lernen aus kontrollierten Ausfallexperimenten
SRE als reine Form von DevOps
- Integration des SRE in die Workflowprozesse von DevOps
- Kulturelle Ausrichtung und Kooperationspraktiken
- Durchsetzung organisatorischer Transformationen über SRE
Post-Klasse Übungen
- Fallstudien zur großen Systemdesign
- Szenarien zu fortgeschrittener Instrumentierung und Überwachung
- Echtzeit-Problemlösungen bei Zuverlässigkeit
Überprüfung und Prüfvorbereitung
- Zusammenfassende Übersicht des DevOps Institute SRE Practitioner Syllabus
- Musterfragen und Übungstests
- Taktiken für die Prüfung und Empfehlungen
Zusammenfassung und weitere Schritte
Voraussetzungen
- Verständnis der grundlegenden Prinzipien der Site Reliability Engineering (SRE)
- Erfahrung mit DevOps Methoden und den dazu gehörenden Werkzeugen
- Befähigung zur Systemüberwachung, -management von Störungen und Automatisierung
Zielgruppe
- SRE-Professionals, die nach der DevOps Institute SRE Practitioner-Zertifizierung streben
- DevOps-Ingenieure, die auf verlässlichkeitsbasierte Rollen ausgerichtet sind
- Operations-Leiter, die für Vertrauenswürdigkeit und Umsetzung verantwortlich sind
Erfahrungsberichte (4)
Die Aufschlüsselung dessen, was DevOps tun kann. Mögliche Integration der Automatisierung.
Adeyinka Adekoya - NTPF
Kurs - Continuous Testing Foundation (CTF)®
Maschinelle Übersetzung
Arbeiten mit DevOps Toolchain
Kesh - Vodacom
Kurs - DevOps Foundation®
Maschinelle Übersetzung
neue Informationen
Michael Durisin - Deutsche Telekom IT & Telecommunications Slovakia s.r.o
Kurs - Site Reliability Engineering (SRE) Foundation®
Maschinelle Übersetzung
das Thema - SRE
Roman Lajs - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Kurs - Site Reliability Engineering (SRE) Fundamentals
Maschinelle Übersetzung