Schulungsübersicht

Big Data Überblick:

  • Was ist Big Data
  • Warum Big Data an Popularität gewinnt
  • Big Data Fallstudien
  • Merkmale von Big Data
  • Lösungen zur Arbeit mit Big Data.

Hadoop und seine Komponenten:

  • Was ist Hadoop und welche Komponenten hat es.
  • Architektur von Hadoop und die Merkmale der Daten, die es verarbeiten kann/verarbeitet.
  • Kurze Darstellung zur Geschichte von Hadoop, Unternehmen, die es verwenden, und warum sie damit begonnen haben.
  • Framework von Hadoop und seine Komponenten – detailliert erklärt.
  • Was ist HDFS und Lesen/Schreiben im verteilten Dateisystem von Hadoop.
  • Wie man einen Hadoop-Cluster in verschiedenen Modi einrichtet - Einzelknoten/Pseudo/Multi-Knoten-Cluster.

(Dies beinhaltet die Einrichtung eines Hadoop-Clusters in VirtualBox/KVM/VMware, Netzwerkeinstellungen, die sorgfältig überprüft werden müssen, das Ausführen von Hadoop Daemons und das Testen des Clusters).

  • Was ist das MapReduce-Framework und wie funktioniert es.
  • Ausführen von MapReduce-Aufträgen auf dem Hadoop-Cluster.
  • Verständnis der Replikation, Spiegelung und Rack-Awareness im Kontext von Hadoop Clustern.

Planung des Hadoop-Clusters:

  • Wie man seinen Hadoop-Cluster plant.
  • Verständnis von Hardware und Software zur Planung des Hadoop-Clusters.
  • Verständnis der Arbeitslasten und Planung des Clusters, um Ausfälle zu vermeiden und optimale Leistung zu erzielen.

Was ist MapR und warum MapR:

  • Überblick über MapR und seine Architektur.
  • Verständnis und Nutzung des MapR Control Systems, MapR Volumes, Snapshots und Spiegelungen.
  • Planung eines Clusters im Kontext von MapR.
  • Vergleich von MapR mit anderen Distributionen und Apache Hadoop.
  • Installation und Bereitstellung des MapR-Clusters.

Clustereinrichtung & Verwaltung:

  • Verwalten von Diensten, Knoten, Snapshots, Spiegelvolumes und Remote-Kluster.
  • Verständnis und Verwaltung der Knoten.
  • Verständnis der Hadoop-Komponenten, Installieren von Hadoop-Komponenten neben MapR-Diensten.
  • Speichern von Daten im Cluster einschließlich NFS-Verwaltung von Diensten & Knoten.
  • Verwalten der Daten durch Nutzung von Volumes, Verwalten von Benutzern und Gruppen, Zuweisen und Verwalten von Rollen für Knoten, Einbetten/Entfernen von Knoten, Clusterverwaltung und Leistungsüberwachung, Konfigurieren/Auswerten und Überwachen der Metriken zur Leistungsmessung, Konfigurieren und Verwalten der MapR-Sicherheit.
  • Verständnis und Nutzung von M7 - dem nativen Speichersystem für MapR-Tabelle.
  • Clustereinstellungen und Optimierung zur Erreichung bestmöglicher Leistung.

Upgrade des Clusters und Integration in andere Systeme:

  • Upgraden der MapR-Softwareversion und Arten von Updates.
  • Konfigurieren des Mapr-Clusters zur Nutzung des HDFS-Clusters.
  • Einrichten eines MapR-Clusters auf Amazon Elastic MapReduce.

Alle genannten Themen umfassen Demonstrations- und Übungseinheiten, damit die Teilnehmer praktische Erfahrungen mit der Technologie sammeln können.

Voraussetzungen

  • Grundkenntnisse von Linux FS
  • Grundlegendes Java
  • Kenntnisse in Apache Hadoop (empfohlen)
 28 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Erfahrungsberichte (1)

Kommende Kurse

Verwandte Kategorien