Schulungsübersicht

Einführung in Google Colab und Apache Spark

  • Übersicht über Google Colab
  • Einführung in Apache Spark
  • Einrichten von Spark in Google Colab

Datenverarbeitung mit Apache Spark

  • Arbeiten mit RDDs und DataFrames
  • Laden und Verarbeiten großer Datensätze
  • Verwendung von Spark SQL zur Abfrage strukturierter Daten

Erweiterte Analytics mit Spark

  • Maschinelles Lernen mit Spark MLlib
  • Durchführung von Echtzeit-Datenanalysen
  • Verteiltes Rechnen mit Spark

Visualisierung und Collaboration in Google Colab

  • Integration von Colab mit beliebten Visualisierungsbibliotheken
  • Kollaborative Arbeitsabläufe mit Colab Notebooks
  • Teilen und Exportieren der Ergebnisse

Optimierung von Big Data Workflows

  • Einstellen von Spark für die Leistung
  • Optimierung des Speicherverbrauchs
  • Skalieren von Workflows für große Datensätze

Big Data in der Cloud

  • Integration von Google Colab mit cloudbasierten Tools
  • Verwendung von Cloudspeicherung für Big Data
  • Arbeiten mit Spark in verteilten Cloudumgebungen

Fallstudien und Best Practices

  • Überprüfung realer Anwendungen für Big Data
  • Fallstudien unter Verwendung von Apache Spark und Colab
  • Best Practices für Big Data Analytics

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Grundkenntnisse der Konzepte der Datenwissenschaft
  • Familiär mit Apache Spark
  • Python Programmierkenntnisse

Zielgruppe

  • Datenwissenschaftler
  • Data Engineers
  • Forscher, die mit Big Data arbeiten
 14 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (5)

Kommende Kurse

Verwandte Kategorien