Kontakt aufnehmen

Schulungsübersicht

Einführung

  • Übersicht über die Funktionen und Architektur von Spark und Hadoop
  • Verständnis von Big Data
  • Grundlagen der Python-Programmierung

Erste Schritte

  • Einrichtung von Python, Spark und Hadoop
  • Verständnis der Datenstrukturen in Python
  • Verständnis der PySpark-API
  • Verständnis von HDFS und MapReduce

Integration von Spark und Hadoop mit Python

  • Implementierung von Spark RDD in Python
  • Datenverarbeitung mittels MapReduce
  • Erstellung verteilter Datensätze im HDFS

Machine Learning mit Spark MLlib

Verarbeitung von Big Data mit Spark Streaming

Arbeit mit Empfehlungssystemen

Arbeit mit Kafka, Sqoop, Kafka und Flume

Apache Mahout mit Spark und Hadoop

Fehlerbehebung

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Erfahrung mit Spark und Hadoop
  • Programmiererfahrung in Python

Zielgruppe

  • Data Scientists
  • Entwickler
 21 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (3)

Kommende Kurse

Verwandte Kategorien