Kontakt aufnehmen

Schulungsübersicht

Einführung

Dieser Abschnitt bietet einen allgemeinen Überblick darüber, wann 'Maschinelles Lernen' eingesetzt wird, was zu beachten ist und was dies alles bedeutet, einschließlich der Vor- und Nachteile. Datentypen (strukturiert/unstrukturiert/statisch/streamend), Datenvalidität/-volumen, datengetriebene vs. benutzergesteuerte Analysen, statistische Modelle vs. Maschinenlernmodelle, Herausforderungen des unüberwachten Lernens, Bias-Varianz-Trade-off, Iteration/Auswertung, Kreuzvalidierungsansätze, überwachtes/unüberwachtes/verstärkendes Lernen.

HAUPTTHEMEN

1. Naive Bayes verstehen

  • Grundlegende Konzepte bayesscher Methoden
  • Wahrscheinlichkeit
  • Gemeinsame Wahrscheinlichkeit
  • Bedingte Wahrscheinlichkeit mit dem Satz von Bayes
  • Der Naive-Bayes-Algorithmus
  • Die Naive-Bayes-Klassifikation
  • Der Laplace-Schätzwert
  • Verwendung numerischer Merkmale mit Naive Bayes

2. Entscheidungsbäume verstehen

  • Teile und herrsche
  • Der C5.0-Entscheidungsbbaum-Algorithmus
  • Auswahl des besten Split
  • Beschneiden des Entscheidungsbiums

3. Neuronale Netze verstehen

  • Von biologischen zu künstlichen Neuronen
  • Aktivierungsfunktionen
  • Netzwerktopologie
  • Die Anzahl der Schichten
  • Die Richtung der Informationsübertragung
  • Die Anzahl der Knoten in jeder Schicht
  • Ausbildung neuronaler Netze mittels Rückwärtspropagation
  • Deep Learning

4. Support Vector Machines verstehen

  • Klassifikation mit Hyperflächen
  • Finden des maximalen Margin
  • Der Fall linear separierbarer Daten
  • Der Fall nicht-linear separierbarer Daten
  • Einsatz von Kerneln für nicht-lineare Räume

5. Clustering verstehen

  • Clustering als Aufgabe des maschinellen Lernens
  • Der k-Means-Algorithmus für Clustering
  • Einsatz der Distanz zur Zuweisung und Aktualisierung von Clustern
  • Wahl der passenden Anzahl an Clustern

6. Leistungsmessung für Klassifikation

  • Umgang mit Klassifikationsvorhersagedaten
  • Ein genauerer Blick auf Konfusionsmatrizen
  • Auswertung der Leistung mittels Konfusionsmatrizen
  • Über die Genauigkeit hinaus – weitere Leistungsmessungen
  • Der Kappa-Statistik
  • Sensitivität und Spezifität
  • Precision und Recall
  • Das F-Maß
  • Visualisierung von Leistungsabwägungen
  • ROC-Kurven
  • Schätzung der zukünftigen Leistung
  • Die Holdout-Methode
  • Kreuzvalidierung
  • Bootstrap-Stichprobe

7. Standardmodelle für bessere Leistung anpassen

  • Einsatz von caret zur automatisierten Parametersuche
  • Erstellung eines einfach angepassten Modells
  • Anpassung des Tuning-Prozesses
  • Verbesserung der Modellleistung durch Meta-Learning
  • Verstehen von Ensembles
  • Bagging
  • Boosting
  • Random Forests
  • Ausbildung von Random Forests
  • Bewertung der Leistung von Random Forests

NEBENTHEMEN

8. Klassifikation mittels Nachbarn verstehen

  • Der kNN-Algorithmus
  • Berechnung der Distanz
  • Wahl eines angemessenen k
  • Vorbereitung der Daten für die Verwendung mit kNN
  • Warum ist der kNN-Algorithmus 'faul' (lazy)?

9. Klassifikationsregeln verstehen

  • Trennen und herrsche
  • Der One-Rule-Algorithmus
  • Der RIPPER-Algorithmus
  • Regeln aus Entscheidungsbäumen

10. Regression verstehen

  • Einfache lineare Regression
  • Schätzung mittels gewöhnlicher kleinsten Quadrate
  • Korrelationen
  • Multilineare Regression

11. Regressionsbäume und Modellbäume verstehen

  • Hinzufügen von Regression zu Bäumen

12. Assoziationsregeln verstehen

  • Der Apriori-Algorithmus für das Lernen von Assoziationsregeln
  • Messung der Relevanz von Regeln – Support und Konfidenz
  • Erstellung einer Menge von Regeln mit dem Apriori-Prinzip

Zusatzthemen

  • Spark/PySpark/MLlib und Multi-Armed Bandits

Voraussetzungen

Python-Kenntnisse

 21 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (7)

Kommende Kurse

Verwandte Kategorien