Schulungsübersicht

SRE-Antimuster

  • Erkennen von kontraproduktiven Praktiken
  • Einschätzung des Einflusses von Antimustern auf die Zuverlässigkeit
  • Beste Praxis und korrigierende Alternativen

SLO als Proxy für Kundenzufriedenheit

  • Definieren von Service Level Indicators (SLIs) und Service Level Objectives (SLOs)
  • Führung von Fehlerbudgets und Balance zwischen Innovation und Zuverlässigkeit
  • Vermitteln der Grenzen verteilter Systeme

Sicherheit und Zuverlässigkeit in Systemen aufbauen

  • Design für Ausfalltoleranz und -Resilienz
  • Integrieren von Sicherheit in die Zuverlässigkeitsingenieurung
  • Skalierbarkeit und Strategien zur DatenSchutz

Ganzzustandsbeobachtbarkeit

  • Instrumentierung und Metrik Erfassung
  • Verteilte Spurung und synthetische Überwachung
  • Beobachtbarkeit-getriebene Entwicklung

Platform Engineering und AIOps

  • Plattformzentrierte Ingenieuransätze
  • Automatisierung und Orchestrierung in SRE
  • Nutzung von DataOps und operationaler Intelligenz

Vorfall Management im SRE-Umfeld

  • Rollen und Verantwortlichkeiten bei der Vorfallreaktion
  • Anwendung von Frameworks wie OODA
  • Automatisierte Beseitigung und AI/ML-basierte Lösungen

Chaos Engineering

  • Prinzipien und Strategien für Resilienztesten
  • Planung und Durchführung von “Spieltag”-Übungen
  • Lernen aus kontrollierten Ausfallexperimenten

SRE als reine Form von DevOps

  • Integration des SRE in die Workflowprozesse von DevOps
  • Kulturelle Ausrichtung und Kooperationspraktiken
  • Durchsetzung organisatorischer Transformationen über SRE

Post-Klasse Übungen

  • Fallstudien zur großen Systemdesign
  • Szenarien zu fortgeschrittener Instrumentierung und Überwachung
  • Echtzeit-Problemlösungen bei Zuverlässigkeit

Überprüfung und Prüfvorbereitung

  • Zusammenfassende Übersicht des DevOps Institute SRE Practitioner Syllabus
  • Musterfragen und Übungstests
  • Taktiken für die Prüfung und Empfehlungen

Zusammenfassung und weitere Schritte

Voraussetzungen

  • Verständnis der grundlegenden Prinzipien der Site Reliability Engineering (SRE)
  • Erfahrung mit DevOps Methoden und den dazu gehörenden Werkzeugen
  • Befähigung zur Systemüberwachung, -management von Störungen und Automatisierung

Zielgruppe

  • SRE-Professionals, die nach der DevOps Institute SRE Practitioner-Zertifizierung streben
  • DevOps-Ingenieure, die auf verlässlichkeitsbasierte Rollen ausgerichtet sind
  • Operations-Leiter, die für Vertrauenswürdigkeit und Umsetzung verantwortlich sind
 35 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Erfahrungsberichte (4)

Kommende Kurse

Verwandte Kategorien