Schulungsübersicht
Einführung in Apache Iceberg
- Überblick über Apache Iceberg
- Bedeutung und Anwendungsfälle in moderner Datenarchitektur
- Wichtige Merkmale und Vorteile
Kernkonzepte
- Iceberg-Tabellenformat und -Architektur
- Vergleich mit anderen Tabellenformaten
- Partitionierung und Schemaevolution
- Zeitreise und Datenversionierung
Einrichtung von Apache Iceberg
- Installation und Konfiguration
- Integration von Iceberg mit verschiedenen Dataprocessing-Engines
- Einrichten einer Iceberg-Umgebung auf einem lokalen Rechner
Grundlegende Operationen
- Erstellen und Verwalten von Iceberg-Tabellen
- Schreiben in und Lesen aus Iceberg-Tabellen
- Grundlegende CRUD-Operationen
Datenmigration und -integration
- Migrieren von Daten aus Hive und anderen Systemen zu Iceberg
- Integration mit BI-Tools
- Migrieren eines Beispiel-Datensatzes zu Iceberg
Optimierung der Leistung
- Leistungsoptimierungsstrategien
- Optimieren von Abfragen und Datenscans
- Leistungsoptimierung in Iceberg
Überblick über erweiterte Funktionen
- Partitionsevolution und versteckte Partitionierung
- Tabellenevolution und Schemaveränderungen
- Zeitreise- und Rollback-Funktionen
- Implementieren erweiterter Funktionen in Iceberg
Zusammenfassung und weitere Schritte
Voraussetzungen
- Vertrautheit mit Konzepten wie Tabellen, Schemas, Partitionen und Datenimport
- Grundkenntnisse von SQL
Zielgruppe
- Data Engineers
- Datenarchitekten
- Datenanalysten
- Softwareentwickler
Erfahrungsberichte (5)
Die Live-Beispiele
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maschinelle Übersetzung
sehr interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maschinelle Übersetzung
Genügend praktische Umsetzung, der Trainer ist kompetent
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maschinelle Übersetzung
Lernen Sie Spark Streaming, Databricks und AWS Redshift kennen
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maschinelle Übersetzung
Übungsaufgaben
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maschinelle Übersetzung