Schulungsübersicht

Einführung in Data Analysis und Big Data

    Was macht Big Data „groß“? Geschwindigkeit, Volumen, Vielfalt, Wahrhaftigkeit (VVVV)
Grenzen der traditionellen Datenverarbeitung
  • Verteilte Verarbeitung
  • Statistische Analyse
  • Arten der Machine Learning Analyse
  • Data Visualization
  • Big Data Rollen und Verantwortlichkeiten
  • Administratoren, Entwickler, Datenanalysten

      Languages Wird für die Datenanalyse verwendet

    R Language Warum R für Datenanalyse? Datenmanipulation, Berechnung und grafische Darstellung

      Python Warum Python für die Datenanalyse?
    Bearbeiten, Verarbeiten, Bereinigen und Verarbeiten von Daten
  • Ansätze zu Data Analysis
  • Statistische Analyse Zeitreihenanalyse Prognose mit Korrelations- und Regressionsmodellen Inferenz Statistics (Schätzung) Beschreibend Statistics in großen Datenmengen (z. B. Berechnung des Mittelwerts)
  • Machine Learning Überwachtes vs. unüberwachtes Lernen

      Klassifizierung und Clustering
    Kostenschätzung für bestimmte Methoden
  • Filtern
  • Verarbeitung natürlicher Sprache. Verarbeitung von Text
  • Bedeutung des Textes verstehen
  • Automatische Textgenerierung
  • Stimmungsanalyse / Themenanalyse
  • Computer Vision Bilder erfassen, verarbeiten, analysieren und verstehen
  • 3D-Szenen rekonstruieren, interpretieren und verstehen
  • Bilddaten nutzen, um Entscheidungen zu treffen
  • Big Data Infrastruktur
  • Datenspeicherung Relationale Datenbanken (SQL) MySQL Postgres Oracle
  • Nicht relationale Datenbanken (Nr. SQL) Cassandra
  • MongoDB
  • Neo4js
  • Die Nuancen hierarchischer Datenbanken verstehen

      Objektorientierte Datenbanken
    Dokumentorientierte Datenbanken
  • Graphorientierte Datenbanken
  • Andere
  • Verteilte Verarbeitung Hadoop HDFS als verteiltes Dateisystem
  • MapReduce für verteilte Verarbeitung
  • Spark All-in-One-In-Memory-Cluster-Computing-Framework für die Datenverarbeitung in großem Maßstab
  • Strukturiertes Streaming
  • Funke SQL
  • Machine Learning Bibliotheken: MLlib
  • Diagrammverarbeitung mit GraphX
  • ScalaFähigkeit Öffentliche Cloud AWS, Google, Aliyun usw.Private Cloud OpenStack, Cloud Foundry usw.
  • Automatische Skalierbarkeit
  • Die richtige Lösung für das Problem wählen
  • Die Zukunft von Big Data
  • Zusammenfassung und Schlussfolgerung
  • Voraussetzungen

    • Allgemeines Verständnis für Mathematik.
    • Allgemeines Verständnis für Programmierung.
    • Allgemeines Verständnis für Datenbanken.

    Publikum

    • Entwickler/Programmierer
    • IT-Berater
      35 Stunden
     

    Teilnehmerzahl


    Beginnt

    Endet


    Die Termine sind abhängig von der Verfügbarkeit und finden zwischen 09:30 und 16:30 statt.
    Offene Schulungskurse erfordern mindestens 5 Teilnehmer.

    Erfahrungsberichte (2)

    Kombinierte Kurse

    QGIS for Geographic Information System

      21 Stunden

    Verwandte Kategorien