Schulungsübersicht
Einführung
- Übersicht über die Funktionen und Architektur von Spark und Hadoop
- Verständnis von Big Data
- Grundlagen der Python-Programmierung
Erste Schritte
- Einrichtung von Python, Spark und Hadoop
- Verständnis der Datenstrukturen in Python
- Verständnis der PySpark-API
- Verständnis von HDFS und MapReduce
Integration von Spark und Hadoop mit Python
- Implementierung von Spark RDD in Python
- Datenverarbeitung mittels MapReduce
- Erstellung verteilter Datensätze im HDFS
Machine Learning mit Spark MLlib
Verarbeitung von Big Data mit Spark Streaming
Arbeit mit Empfehlungssystemen
Arbeit mit Kafka, Sqoop, Kafka und Flume
Apache Mahout mit Spark und Hadoop
Fehlerbehebung
Zusammenfassung und nächste Schritte
Voraussetzungen
- Erfahrung mit Spark und Hadoop
- Programmiererfahrung in Python
Zielgruppe
- Data Scientists
- Entwickler
Erfahrungsberichte (3)
Die Tatsache, dass wir die meisten Informationen, Kurse, Präsentationen und Übungen mitnehmen konnten, sodass wir sie noch einmal durchgehen und eventuell das Wiederholen können, was wir beim ersten Mal nicht verstanden haben, oder das Verbessern, was wir bereits gemacht haben.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maschinelle Übersetzung
Mir hat gefallen, dass es die Grundlagen des Themas vermittelt und gleichzeitig zu ziemlich fortgeschrittenen Übungen vorgeschritten ist. Es bot auch einfache Möglichkeiten, den Code zu schreiben und zu testen.
Ionut Goga - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maschinelle Übersetzung
Die Live-Beispiele
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maschinelle Übersetzung