Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Big Data Überblick:
- Was ist Big Data
- Warum Big Data an Popularität gewinnt
- Big Data Fallstudien
- Merkmale von Big Data
- Lösungen zur Arbeit mit Big Data.
Hadoop und seine Komponenten:
- Was ist Hadoop und welche Komponenten hat es.
- Architektur von Hadoop und die Merkmale der Daten, die es verarbeiten kann/verarbeitet.
- Kurze Darstellung zur Geschichte von Hadoop, Unternehmen, die es verwenden, und warum sie damit begonnen haben.
- Framework von Hadoop und seine Komponenten – detailliert erklärt.
- Was ist HDFS und Lesen/Schreiben im verteilten Dateisystem von Hadoop.
- Wie man einen Hadoop-Cluster in verschiedenen Modi einrichtet - Einzelknoten/Pseudo/Multi-Knoten-Cluster.
(Dies beinhaltet die Einrichtung eines Hadoop-Clusters in VirtualBox/KVM/VMware, Netzwerkeinstellungen, die sorgfältig überprüft werden müssen, das Ausführen von Hadoop Daemons und das Testen des Clusters).
- Was ist das MapReduce-Framework und wie funktioniert es.
- Ausführen von MapReduce-Aufträgen auf dem Hadoop-Cluster.
- Verständnis der Replikation, Spiegelung und Rack-Awareness im Kontext von Hadoop Clustern.
Planung des Hadoop-Clusters:
- Wie man seinen Hadoop-Cluster plant.
- Verständnis von Hardware und Software zur Planung des Hadoop-Clusters.
- Verständnis der Arbeitslasten und Planung des Clusters, um Ausfälle zu vermeiden und optimale Leistung zu erzielen.
Was ist MapR und warum MapR:
- Überblick über MapR und seine Architektur.
- Verständnis und Nutzung des MapR Control Systems, MapR Volumes, Snapshots und Spiegelungen.
- Planung eines Clusters im Kontext von MapR.
- Vergleich von MapR mit anderen Distributionen und Apache Hadoop.
- Installation und Bereitstellung des MapR-Clusters.
Clustereinrichtung & Verwaltung:
- Verwalten von Diensten, Knoten, Snapshots, Spiegelvolumes und Remote-Kluster.
- Verständnis und Verwaltung der Knoten.
- Verständnis der Hadoop-Komponenten, Installieren von Hadoop-Komponenten neben MapR-Diensten.
- Speichern von Daten im Cluster einschließlich NFS-Verwaltung von Diensten & Knoten.
- Verwalten der Daten durch Nutzung von Volumes, Verwalten von Benutzern und Gruppen, Zuweisen und Verwalten von Rollen für Knoten, Einbetten/Entfernen von Knoten, Clusterverwaltung und Leistungsüberwachung, Konfigurieren/Auswerten und Überwachen der Metriken zur Leistungsmessung, Konfigurieren und Verwalten der MapR-Sicherheit.
- Verständnis und Nutzung von M7 - dem nativen Speichersystem für MapR-Tabelle.
- Clustereinstellungen und Optimierung zur Erreichung bestmöglicher Leistung.
Upgrade des Clusters und Integration in andere Systeme:
- Upgraden der MapR-Softwareversion und Arten von Updates.
- Konfigurieren des Mapr-Clusters zur Nutzung des HDFS-Clusters.
- Einrichten eines MapR-Clusters auf Amazon Elastic MapReduce.
Alle genannten Themen umfassen Demonstrations- und Übungseinheiten, damit die Teilnehmer praktische Erfahrungen mit der Technologie sammeln können.
Voraussetzungen
- Grundkenntnisse von Linux FS
- Grundlegendes Java
- Kenntnisse in Apache Hadoop (empfohlen)
28 Stunden
Erfahrungsberichte (1)
praktische Dinge der Umsetzung, auch die Theorie wurde gut von Ajay vermittelt
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurs - Hadoop Administration on MapR
Maschinelle Übersetzung