Schulungsübersicht
Einführung
Überblick über Datenzugangsmethoden (Hive, Datenbanken usw.)
Überblick über Spark-Funktionen und -Architektur
Installation und Konfiguration von Spark
Verständnis von Dataframes in Spark
Tabellen definieren und Datensätze importieren
Datensets mit SQL abfragen
Aggregationen, JOINs und verschachtelte Abfragen durchführen
Daten hochladen und darauf zugreifen
Verschiedene Arten von Daten abfragen
- JSON, Parquet usw.
Datenseen mit SQL abfragen
Fehlerbehebung
Zusammenfassung und Fazit
Voraussetzungen
- Erfahrung mit SQL-Abfragen
- Programmiererfahrung in einer beliebigen Sprache
Zielgruppe
- Datenanalysten
- Datenscientisten
- Dateningenieure
Erfahrungsberichte (5)
Die Live-Beispiele
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maschinelle Übersetzung
sehr interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maschinelle Übersetzung
Genügend praktische Umsetzung, der Trainer ist kompetent
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maschinelle Übersetzung
Lernen Sie Spark Streaming, Databricks und AWS Redshift kennen
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maschinelle Übersetzung
Übungsaufgaben
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maschinelle Übersetzung