Data Mining with Weka Schulung
Waikato Environment for Knowledge Analysis (Weka) ist eine Open-Source-Software zur Visualisierung von Data Mining. Sie bietet eine Sammlung von Algorithmen des maschinellen Lernens für Datenaufbereitung, Klassifizierung, Clustering und andere Data-Mining-Aktivitäten.
Diese von einem Kursleiter geleitete Live-Schulung (online oder vor Ort) richtet sich an Anfänger bis fortgeschrittene Datenanalysten und Datenwissenschaftler, die Weka für Data-Mining-Aufgaben einsetzen möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- Weka zu installieren und zu konfigurieren.
- Die Weka-Umgebung und -Workbench zu verstehen.
- Data-Mining-Aufgaben mit Weka durchzuführen.
Format des Kurses
- Interaktive Vorlesung und Diskussion.
- Viele Übungen und Praxis.
- Praktische Umsetzung in einer Live-Laborumgebung.
Optionen zur Kursanpassung
- Wenn Sie eine maßgeschneiderte Schulung für diesen Kurs wünschen, nehmen Sie bitte Kontakt mit uns auf, um dies zu vereinbaren.
Schulungsübersicht
Einführung
- Überblick über Weka
- Verstehen des Data-Mining-Prozesses
Erste Schritte
- Installieren und Konfigurieren von Weka
- Verstehen der Weka-Benutzeroberfläche
- Einrichten der Umgebung und des Projekts
- Erkunden der Weka-Workbench
- Laden und Untersuchen des Datensatzes
Implementieren von Regressionsmodellen
- Verstehen der verschiedenen Regressionsmodelle
- Verarbeiten und Speichern der verarbeiteten Daten
- Evaluierung eines Modells mit Kreuzvalidierung
- Serialisieren und Visualisieren eines Entscheidungsbaummodells
Implementieren von Klassifizierungsmodellen
- Verstehen der Merkmalsauswahl und Datenverarbeitung
- Erstellen und Auswerten von Klassifikationsmodellen
- Aufbau und Visualisierung eines Entscheidungsbaummodells
- Kodierung von Textdaten in numerischer Form
- Durchführen von Klassifizierungen auf Textdaten
Implementierung von Clustering-Modellen
- Verstehen von K-means Clustering
- Normalisierung und Visualisierung von Daten
- Durchführen von K-means Clustering
- Durchführen von hierarchischem Clustering
- Durchführen von EM-Clustering
Bereitstellen eines Weka-Modells
Fehlersuche
Zusammenfassung und nächste Schritte
Voraussetzungen
- Grundkenntnisse über Data-Mining-Verfahren und -Techniken
Zielgruppe
- Datenanalysten
- Datenwissenschaftler
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.
Data Mining with Weka Schulung - Booking
Data Mining with Weka Schulung - Enquiry
Data Mining with Weka - Beratungsanfrage
Beratungsanfrage
Erfahrungsberichte (5)
wie der Trainer sein Wissen im Unterrichtsthema zeigt
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Kurs - Data Vault: Building a Scalable Data Warehouse
Maschinelle Übersetzung
Offene Diskussion mit dem Trainer
Tomek Danowski - GE Medical Systems Polska Sp. Z O.O.
Kurs - Process Mining
Maschinelle Übersetzung
Sehr nützlich, weil es mir hilft zu verstehen, was wir mit den Daten in unserem Kontext tun können. Es wird mich auch dabei unterstützen
Nicolas NEMORIN - Adecco Groupe France
Kurs - KNIME Analytics Platform for BI
Maschinelle Übersetzung
Ich habe die Übungen mit der Hand-zu-Hand-Methode wirklich genossen.
Yunfa Zhu - Environmental and Climate Change Canada
Kurs - Foundation R
Maschinelle Übersetzung
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.
Jamie Martin-Royle - NBrown Group
Kurs - From Data to Decision with Big Data and Predictive Analytics
Maschinelle Übersetzung
Kommende Kurse
Kombinierte Kurse
From Data to Decision with Big Data and Predictive Analytics
21 StundenPublikum
Wenn Sie versuchen, aus den Daten, auf die Sie Zugriff haben, einen Sinn zu machen, oder wenn Sie unstrukturierte Daten analysieren möchten, die im Internet verfügbar sind (z. B. Twitter, Linked in usw.), ist dieser Kurs für Sie.
Es richtet sich hauptsächlich an Entscheidungsträger und Personen, die entscheiden müssen, welche Daten gesammelt und welche analysiert werden sollten.
Es richtet sich nicht an Personen, die die Lösung konfigurieren. Diese Personen werden jedoch vom Gesamtüberblick profitieren.
Lieferungsmodus
Während des Kurses werden den Teilnehmern Arbeitsbeispiele von meist Open Source-Technologien vorgestellt.
Auf kurze Vorträge folgen Präsentationen und einfache Übungen der Teilnehmer
Inhalt und verwendete Software
Die gesamte verwendete Software wird jedes Mal aktualisiert, wenn der Kurs ausgeführt wird. Wir überprüfen daher die neuesten Versionen.
Es umfasst den Prozess vom Abrufen, Formatieren, Verarbeiten und Analysieren der Daten, um zu erklären, wie der Entscheidungsprozess mit maschinellem Lernen automatisiert werden kann.
Data Mining and Analysis
28 StundenZielsetzung:
Die Teilnehmer sind in der Lage, große Datensätze zu analysieren, Muster zu extrahieren und die richtigen Variablen auszuwählen, die sich auf die Ergebnisse auswirken, so dass ein neues Modell mit prädiktiven Ergebnissen prognostiziert werden kann.
Data Mining
21 StundenDer Kurs kann mit allen Tools bereitgestellt werden, einschließlich kostenloser Open-Source-Data-Mining-Software und Anwendungen
Data Mining with Python
14 StundenDiese Live-Schulung (vor Ort oder per Fernzugriff) richtet sich an Datenanalysten und Datenwissenschaftler, die fortgeschrittenere Datenanalysetechniken für das Data Mining mit Python implementieren möchten.
Am Ende dieser Schulung können die Teilnehmer:
- Wichtige Bereiche des Data Mining verstehen, einschließlich Assoziationsregel-Mining, Textstimmungsanalyse, automatische Textzusammenfassung und Erkennung von Datenanomalien.
- Verschiedene Strategien zur Lösung realer Data-Mining-Probleme vergleichen und implementieren.
- Die Ergebnisse verstehen und interpretieren.
Format des Kurses
- Interaktiver Vortrag und Diskussion.
- Viele Übungen und praktische Anwendungen.
- Praktische Umsetzung in einer Live-Lab-Umgebung.
Anpassungsoptionen für den Kurs
- Um eine individuelle Schulung für diesen Kurs anzufordern, kontaktieren Sie uns bitte, um eine Vereinbarung zu treffen.
Data Mining with R
14 StundenR ist eine freie Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Anzahl von Managern und Datenanalysten in Unternehmen und Hochschulen verwendet. R bietet eine Vielzahl von Paketen für das Data Mining.
Data Vault: Building a Scalable Data Warehouse
28 StundenIn dieser von einem Ausbilder geleiteten Live-Schulung in Österreich lernen die Teilnehmer, wie man ein Data Vault erstellt.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- die Architektur und die Designkonzepte hinter Data Vault 2.0 und ihre Interaktion mit Big Data, NoSQL und KI zu verstehen.
- Data Vaulting-Techniken anwenden, um Auditing, Tracing und Inspektion von historischen Daten in einem Data Warehouse zu ermöglichen.
- Entwicklung eines konsistenten und wiederholbaren ETL-Prozesses (Extract, Transform, Load).
- Aufbau und Bereitstellung hoch skalierbarer und wiederholbarer Warehouses.
Data Visualization
28 StundenDieser Kurs richtet sich an Ingenieure und Entscheidungsträger, die im Bereich Data Mining und Knowledge Discovery arbeiten.
Sie lernen, wie Sie effektive Diagramme erstellen und Ihre Daten so präsentieren und darstellen, dass sie die Entscheidungsträger ansprechen und ihnen helfen, verborgene Informationen zu verstehen.
Data Mining & Machine Learning with R
14 StundenR ist eine kostenlose Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Zahl von Managern und Datenanalysten in Unternehmen und in der Wissenschaft verwendet. R verfügt über eine Vielzahl von Paketen für Data Mining.
Data Science for Big Data Analytics
35 StundenBig Data sind Datenmengen, die so umfangreich und komplex sind, dass herkömmliche Anwendungssoftware für die Datenverarbeitung nicht ausreicht, um mit ihnen umzugehen. Zu den großen Datenherausforderungen gehören Datenerfassung, Datenspeicherung, Datenanalyse, Suche, Freigabe, Übertragung, Visualisierung, Abfrage, Aktualisierung und Datenschutz.
Foundation R
7 StundenDieser von einem Trainer durchführte Live-Kurs in Österreich (online oder vor Ort) richtet sich an Anfängerinnen und Anfänger, die eine fundierte Kenntnis der Grundlagen von R und der Arbeit mit Daten erlangen möchten.
Am Ende dieses Kurses werden die TeilnehmerInnen in der Lage sein:
- Das R-Programmierumgebung und die RStudio-Oberfläche zu verstehen.
- Datensätze mithilfe von R-Befehlen und -Paketen einzulesen, zu manipulieren und zu erkunden.
- Einfache statistische Analysen durchzuführen und Daten zusammenzufassen.
- Mithilfe sowohl der Basissyntax von R als auch ggplot2 Visualisierungen zu erstellen.
- Arbeitsumgebungen, Skripte und Pakete effektiv zu verwalten.
KNIME Analytics Platform for BI
21 StundenKNIME Analytics Platform ist eine führende Open-Source-Option für datengetriebene Innovationen. Sie hilft Ihnen dabei, das in Ihren Daten verborgene Potenzial zu entdecken, neue Erkenntnisse zu gewinnen oder neue Zukünfte vorherzusagen. Mit mehr als 1000 Modulen, Hunderten von einsatzbereiten Beispielen, einer umfassenden Palette integrierter Tools und der größten Auswahl an fortschrittlichen Algorithmen ist die KNIME Analytics Platform die perfekte Toolbox für jeden Datenwissenschaftler und Geschäftsanalysten.
Dieser Kurs für die KNIME Analytics-Plattform ist eine ideale Gelegenheit für Anfänger, fortgeschrittene Benutzer und KNIME Experten, um sich mit KNIME zu machen, seine effektivere Verwendung zu erlernen und klare, umfassende Berichte auf der Grundlage von KNIME Workflows zu erstellen
Oracle SQL Intermediate - Data Extraction
14 StundenZiel des Kurses ist es, die Teilnehmer in die Lage zu versetzen, die Arbeit mit der Sprache SQL in der Datenbank Oracle zur Datenextraktion auf mittlerem Niveau zu beherrschen.
Process Mining
21 StundenProcess Mining oder Automated Business Process Discovery (ABPD) ist eine Technik, die Algorithmen auf Ereignisprotokolle anwendet, um Geschäftsprozesse zu analysieren. Process Mining geht über die Datenspeicherung und Datenanalyse hinaus; es verbindet Daten mit Prozessen und bietet Einblicke in die Trends und Muster, die die Prozesseffizienz beeinflussen.
Format des Kurses
- Der Kurs beginnt mit einem Überblick über die am häufigsten verwendeten Techniken für Process Mining. Wir besprechen die verschiedenen Algorithmen und Werkzeuge zur Prozesserkennung, die für die Erkennung und Modellierung von Prozessen auf der Grundlage von Ereignisrohdaten verwendet werden. Es werden Fallstudien aus der Praxis untersucht und Datensätze mit Hilfe des Open-Source-Frameworks ProM analysiert.
Introductory R for Biologists
28 StundenR ist eine freie Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Anzahl von Managern und Datenanalysten in Unternehmen und Hochschulen verwendet. R hat auch Anhänger unter Statistikern, Ingenieuren und Wissenschaftlern ohne Programmierkenntnisse gefunden, die es einfach finden, es zu benutzen. Seine Popularität ist auf den zunehmenden Einsatz von Data Mining für verschiedene Zwecke zurückzuführen, z. B. die Festlegung von Anzeigenpreisen, die schnellere Suche nach neuen Arzneimitteln oder die Feinabstimmung von Finanzmodellen. R bietet eine Vielzahl von Paketen für das Data Mining.
Statistik mit SPSS Predictive Analytics SoftWare
14 StundenGoal:
Lernen mit SPSS auf der Ebene der Selbständigkeit zu arbeiten
Die Adressaten:
Analysten, Forscher, Wissenschaftler, Studenten und alle, die die Fähigkeit erwerben wollen, das SPSS-Paket zu verwenden und beliebte Data-Mining-Techniken zu erlernen.