Schulungsübersicht
Einführung
Überblick über Datenzugangsmethoden (Hive, Datenbanken usw.)
Überblick über Spark-Funktionen und -Architektur
Installation und Konfiguration von Spark
Verständnis von Dataframes in Spark
Tabellen definieren und Datensätze importieren
Datensets mit SQL abfragen
Aggregationen, JOINs und verschachtelte Abfragen durchführen
Daten hochladen und darauf zugreifen
Verschiedene Arten von Daten abfragen
- JSON, Parquet usw.
Datenseen mit SQL abfragen
Fehlerbehebung
Zusammenfassung und Fazit
Voraussetzungen
- Erfahrung mit SQL-Abfragen
- Programmiererfahrung in einer beliebigen Sprache
Zielgruppe
- Datenanalysten
- Datenscientisten
- Dateningenieure
Erfahrungsberichte (5)
Die Tatsache, dass wir die meisten Informationen, Kurse, Präsentationen und Übungen mitnehmen konnten, sodass wir sie noch einmal durchgehen und eventuell das Wiederholen können, was wir beim ersten Mal nicht verstanden haben, oder das Verbessern, was wir bereits gemacht haben.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maschinelle Übersetzung
sehr interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maschinelle Übersetzung
Ausreichend praktische Übungen, der Trainer ist wissensreich
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maschinelle Übersetzung
Erfahren Sie mehr über Spark Streaming, Databricks und AWS Redshift.
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maschinelle Übersetzung
Übungsaufgaben
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maschinelle Übersetzung