Schulungsübersicht
Einführung in Apache Iceberg
- Überblick über Apache Iceberg
- Bedeutung und Anwendungsfälle in moderner Datenarchitektur
- Wichtige Merkmale und Vorteile
Kernkonzepte
- Iceberg-Tabellenformat und -Architektur
- Vergleich mit anderen Tabellenformaten
- Partitionierung und Schemaevolution
- Zeitreise und Datenversionierung
Einrichtung von Apache Iceberg
- Installation und Konfiguration
- Integration von Iceberg mit verschiedenen Dataprocessing-Engines
- Einrichten einer Iceberg-Umgebung auf einem lokalen Rechner
Grundlegende Operationen
- Erstellen und Verwalten von Iceberg-Tabellen
- Schreiben in und Lesen aus Iceberg-Tabellen
- Grundlegende CRUD-Operationen
Datenmigration und -integration
- Migrieren von Daten aus Hive und anderen Systemen zu Iceberg
- Integration mit BI-Tools
- Migrieren eines Beispiel-Datensatzes zu Iceberg
Optimierung der Leistung
- Leistungsoptimierungsstrategien
- Optimieren von Abfragen und Datenscans
- Leistungsoptimierung in Iceberg
Überblick über erweiterte Funktionen
- Partitionsevolution und versteckte Partitionierung
- Tabellenevolution und Schemaveränderungen
- Zeitreise- und Rollback-Funktionen
- Implementieren erweiterter Funktionen in Iceberg
Zusammenfassung und weitere Schritte
Voraussetzungen
- Vertrautheit mit Konzepten wie Tabellen, Schemas, Partitionen und Datenimport
- Grundkenntnisse von SQL
Zielgruppe
- Data Engineers
- Datenarchitekten
- Datenanalysten
- Softwareentwickler
Erfahrungsberichte (5)
Die Tatsache, dass wir die meisten Informationen, Kurse, Präsentationen und Übungen mitnehmen konnten, sodass wir sie noch einmal durchgehen und eventuell das Wiederholen können, was wir beim ersten Mal nicht verstanden haben, oder das Verbessern, was wir bereits gemacht haben.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maschinelle Übersetzung
sehr interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maschinelle Übersetzung
Ausreichend praktische Übungen, der Trainer ist wissensreich
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maschinelle Übersetzung
Erfahren Sie mehr über Spark Streaming, Databricks und AWS Redshift.
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maschinelle Übersetzung
Übungsaufgaben
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maschinelle Übersetzung