Data Science Programme Schulung
Die Informations- und Datenexplosion in der heutigen Welt ist beispiellos, unsere Fähigkeit zur Innovation und zur Erweiterung der Grenzen des Möglichen wächst schneller als je zuvor. Die Rolle des Data Scientist ist heute branchenweit eine der gefragtesten Fähigkeiten.
Wir bieten viel mehr als nur theoretisches Lernen; Wir vermitteln praktische, marktfähige Fähigkeiten, die die Lücke zwischen der akademischen Welt und den Anforderungen der Industrie schließen.
Dieser 7-wöchige Lehrplan kann auf Ihre spezifischen Branchenanforderungen zugeschnitten werden. Bitte kontaktieren Sie uns für weitere Informationen oder besuchen Sie die Website des Nobleprog Institute
Publikum:
Dieses Programm richtet sich an Hochschulabsolventen sowie an alle, die über die erforderlichen Vorkenntnisse verfügen, die durch eine Beurteilung und ein Vorstellungsgespräch ermittelt werden.
Lieferung:
Die Durchführung des Kurses erfolgt als Mischung aus Präsenzunterricht und Online-Kursen; Typischerweise wird die 1. Woche „im Klassenzimmer geführt“, die Wochen 2–6 im „virtuellen Klassenzimmer“ und Woche 7 wieder im „Klassenzimmer geleitet“.
Schulungsübersicht
Woche 1 Big Data Konzepte
- VVVV (Geschwindigkeit, Volumen, Vielfalt, Wahrhaftigkeit) Definition
- Grenzen der traditionellen Datenverarbeitungskapazität
- Verteilte Verarbeitung
- Statistische Analyse
- Machine Learning Analysearten
- Data Visualization
- Verteilte Verarbeitung (z.B. map-reduce)
- Einführung in die verwendeten Sprachen
- R Sprache Crash-Kurs
- Python Crash-Kurs
Wochen 2&3 Durchführen Data Analysis
- Statistische Analyse
- Deskriptiv Statistics in Big Data Mengen (z.B. Mittelwertberechnung)
- Inferentiell Statistics (Schätzung)
- Forecasting mit Korrelations- und Regressionsmodellen
- Zeitreihenanalyse
- Grundlagen von Machine Learning
- Überwachtes vs. unüberwachtes Lernen
- Klassifizierung und Clustering
- Abschätzung der Kosten spezifischer Methoden
- Filter
Woche 4 Verarbeitung natürlicher Sprache
- Verarbeitung von Text
- Verstehen der Bedeutung des Textes
- Automatische Texterzeugung
- Analyse von Sätzen/Themen
- Computer Sehen
Woche 5&6 Tooling-Konzept
- Datenspeicherlösung (SQL, NoSQL, hierarchisch, objektorientiert, dokumentenorientiert)
- MySQL, Cassandra, MongoDB, Elasticsearch, HDFS, etc...)
- Auswahl der richtigen Lösung für das Problem
- Verteilte Verarbeitung
- Spark
- Machine Learning mit Spark (MLLib)
- Spark SQL
- Scalability
- Öffentliche Cloud (AWS, Google, etc...)
- Private Cloud (OpenStack, Cloud Foundry)
- Autoskalierbarkeit
Woche 7 Soft Skills
- Beratung & Leadership Fertigkeiten
- Wirkung erzielen: datengestütztes Storytelling
- Verstehen Sie Ihr Publikum
- Effektive Datenpräsentation - wie Sie Ihre Botschaft vermitteln
- Effektive Beeinflussung und Führung im Wandel
- Umgang mit schwierigen Situationen
Prüfung
- Abschlussprüfung am Ende des Programms
Voraussetzungen
Die Teilnehmer müssen über gute Mathematikkenntnisse verfügen, mindestens auf Gymnasialniveau.
Programmierkenntnisse sind zwar nicht erforderlich, aber dennoch nützlich.
Die Teilnehmer werden vor der Teilnahme an diesem Schulungsprogramm beurteilt und befragt.
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.
Data Science Programme Schulung - Booking
Data Science Programme Schulung - Enquiry
Data Science Programme - Beratungsanfrage
Beratungsanfrage
Erfahrungsberichte (5)
Besseres Verständnis von Big Data
Shaune Dennis - Vodacom
Kurs - Big Data Business Intelligence for Telecom and Communication Service Providers
Maschinelle Übersetzung
Der Trainer war anpassungsfähig und hat mich tatsächlich ermutigt, den Kurs zu belegen.
Grace Goh - DBS Bank Ltd
Kurs - Python in Data Science
Maschinelle Übersetzung
Maschinelles Lernen, Python, Datenmanipulation
Siphelo Mapolisa - University Of South Africa
Kurs - Data Science: Analysis and Presentation
Maschinelle Übersetzung
Fächerpräsentation Wissenszeitplanung
Aly Saleh - FAB banak Egypt
Kurs - Introduction to Data Science and AI (using Python)
Maschinelle Übersetzung
Es ist großartig, dass der Kurs auf die Schlüsselbereiche zugeschnitten wird, die ich im Vor-Kurs-Fragebogen hervorgehoben habe. Dies hilft wirklich dabei, meine Fragen zum Stoff zu klären und mit meinen Lernzielen auszugleichen.
Winnie Chan - Statistics Canada
Kurs - Jupyter for Data Science Teams
Maschinelle Übersetzung
Kommende Kurse
Kombinierte Kurse
Introduction to Data Science and AI using Python
35 StundenDies ist eine fünftägige Einführung in Data Science und AI.
Der Kurs wird mit Beispielen und Übungen mit Python geliefert
Anaconda Ecosystem for Data Scientists
14 StundenDiese von einem Dozenten geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler, die das Anaconda-Ökosystem zur Erfassung, Verwaltung und Bereitstellung von Paketen und Datenanalyse-Workflows auf einer einzigen Plattform nutzen möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- Anaconda-Komponenten und -Bibliotheken zu installieren und zu konfigurieren.
- Die Kernkonzepte, Funktionen und Vorteile von Anaconda zu verstehen.
- Pakete, Umgebungen und Kanäle mit Anaconda Navigator zu verwalten.
- Conda, R und Python Pakete für Data Science und maschinelles Lernen verwenden.
- Sie lernen einige praktische Anwendungsfälle und Techniken für die Verwaltung mehrerer Datenumgebungen kennen.
Big Data Business Intelligence for Telecom & Communication Service Providers
35 StundenÜberblick
Communications Service Provider (CSP) stehen unter Druck, um die Kosten zu senken und das durchschnittliche Einkommen pro Benutzer (ARPU) zu maximieren, während eine ausgezeichnete Kundenerfahrung gewährleistet wird, aber Datenvolumen weiter wachsen. Der weltweite mobile Datenverkehr wird bei einer kombinierten jährlichen Wachstumsrate (CAGR) von 78 Prozent bis 2016 auf 10,8 exabytes pro Monat wachsen.
Währenddessen generieren CSPs große Datenvolumen, einschließlich Call Details Records (CDR), Netzwerkdaten und Kundendaten. Unternehmen, die diese Daten vollumfänglich nutzen, gewinnen einen wettbewerbsfähigen Rand. Laut einer jüngsten Umfrage der The Economist Intelligence Unit genießen Unternehmen, die Datenorientierte Entscheidungsfindung nutzen, eine Produktivitätserhöhung von 5-6%. Doch 53% der Unternehmen nutzen nur die Hälfte ihrer wertvollen Daten, und ein Viertel der Befragten bemerkte, dass große Mengen nützlicher Daten unvergesslich sind. Die Datenvolume sind so hoch, dass manuelle Analyse unmöglich ist, und die meisten Legacy-Software-Systeme können nicht aufrechterhalten, was zu wertvollen Daten führt, die abgelehnt oder ignoriert werden.
Mit Big Data & Analytics’ High-Speed, scalable Big Data-Software können CSPs alle ihre Daten für bessere Entscheidungsfindung in weniger Zeit minieren. Verschiedene Big Data Produkte und Techniken bieten eine End-to-End-Software-Plattform für die Sammlung, Vorbereitung, Analyse und Präsentation von Einsichten aus großen Daten. Anwendungsbereiche umfassen Netzwerkleistungsüberwachung, Betrugdetektion, Kundenschurndetektion und Kreditrisikoanalyse. Big Data & Analytics-Produkte schaal, um Terabytes von Daten zu verarbeiten, aber die Implementierung solcher Tools erfordert eine neue Art von Cloud-basiertes Datenbank-System wie Hadoop oder massive schaal parallele Computing-Prozessor (KPU usw.)
Dieser Kurs arbeitet auf Big Data BI für Telco umfasst alle aufstrebenden neuen Bereiche, in denen CSPs für Produktivitätsgewinnung und die Eröffnung neuer Geschäftsausgabenströme investieren. Der Kurs bietet eine vollständige 360 Grad Überblick Big Data BI in Telco, so dass Entscheidungsträger und Manager eine sehr breite und umfassende Überblick über die Möglichkeiten Big Data BI in Telco für Produktivität und Einkommensgewinnung haben können.
Kursziele
Das Hauptziel des Kurses ist es, neue Big Data Business Intelligence-Techniken in 4 Sektoren Telecom Business (Marketing/Sales, Network Operation, Financial Operation und Customer Relation Management) einzuführen. Die Studierenden werden eingeführt, um zu folgen:
- Einführung zu Big Data-was ist 4Vs (Volumen, Geschwindigkeit, Vielfalt und Wahrscheinlichkeit) in Big Data- Generation, Extraction und Management aus Telco Perspektive
- Wie Big Data Analytik unterscheidet sich von Erbe-Datenanalytik
- In-house Begründung von Big Data -Telco Perspektive
- Einführung in Hadoop Ökosystem- Bekanntschaft mit allen Hadoop Tools wie Hive, Pig, SPARC –Wenn und wie sie verwendet werden, um das Problem zu lösen Big Data
- Wie Big Data zur Analyse für Analyse-Tool-Wie Business Analysis’s können ihre Schmerzpunkte der Sammlung und Analyse von Daten durch integrierte Hadoop Dashboard-Ansatz reduzieren
- Grundlegende Einführung in Insight-Analysen, Visualisierungsanalysen und Predictive-Analysen für Telco
- Customer Churn-Analytics und Big Data-how Big Data-Analytics können Customer Churn und Kundenunzufriedenheit in Telco-Case-Studien reduzieren
- Netzwerkfehler- und Servicefehleranalyse aus Netzwerkmetadata und IPDR
- Finanzanalyse - Betrug, Wastage und ROI-Schätzung aus Verkaufs- und Betriebsdaten
- Kundenaufnahme-Problem-Zielmarketing, Kundensegmentation und Cross-Sales von Verkaufsdaten
- Einführung und Zusammenfassung aller Big Data analytischen Produkte und wo sie in den analytischen Raum von Telco passen
- Schlussfolgerung - wie man Schritt für Schritt einen Ansatz zur Einführung Big Data Business Intelligence in Ihre Organisation einnehmen kann
Zielgruppe
- Netzwerkverkehr, Finanzmanager, CRM-Manager und Top-IT-Manager im Telco CIO-Büro.
- Business Analytiker in Telco
- CFO Büro-Manager / Analysten
- Operationsmanager
- QA Manager
A Practical Introduction to Data Science
35 StundenDie Teilnehmer, die diese Schulung absolvieren, erhalten ein praktisches, praxisnahes Verständnis von Data Science und den damit verbundenen Technologien, Methoden und Werkzeugen.
Die Teilnehmer haben die Möglichkeit, dieses Wissen durch praktische Übungen in die Praxis umzusetzen. Die Interaktion in der Gruppe und das Feedback des Kursleiters sind ein wichtiger Bestandteil des Kurses.
Der Kurs beginnt mit einer Einführung in die grundlegenden Konzepte von Data Science und geht dann auf die in Data Science verwendeten Werkzeuge und Methoden ein.
Teilnehmerkreis
- Entwickler
- Technische Analysten
- IT-Berater
Format des Kurses
- Teilweise Vorlesung, teilweise Diskussion, Übungen und umfangreiche praktische Übungen
Hinweis
- Wenn Sie eine maßgeschneiderte Schulung für diesen Kurs wünschen, nehmen Sie bitte Kontakt mit uns auf, um dies zu vereinbaren.
Data Science for Big Data Analytics
35 StundenBig Data sind Datenmengen, die so umfangreich und komplex sind, dass herkömmliche Anwendungssoftware für die Datenverarbeitung nicht ausreicht, um mit ihnen umzugehen. Zu den großen Datenherausforderungen gehören Datenerfassung, Datenspeicherung, Datenanalyse, Suche, Freigabe, Übertragung, Visualisierung, Abfrage, Aktualisierung und Datenschutz.
Data Science essential for Marketing/Sales professionals
21 StundenDieser Kurs richtet sich an Marketing Vertriebsprofis, die tiefer in die Anwendung von Data Science im Marketing/Vertrieb einsteigen möchten. Der Kurs bietet eine detaillierte Abdeckung verschiedener datenwissenschaftlicher Techniken, die für „Upsale“, „Cross-Sale“, Marktsegmentierung, Branding und CLV verwendet werden.
Unterschied zwischen Marketing und Vertrieb – Wie unterscheiden sich Vertrieb und Marketing?
In sehr einfachen Worten kann Verkauf als ein Prozess bezeichnet werden, der sich auf Einzelpersonen oder kleine Gruppen konzentriert oder darauf abzielt. Marketing hingegen richtet sich an eine größere Gruppe bzw. die breite Öffentlichkeit. Marketing umfasst Forschung (Identifizierung der Bedürfnisse des Kunden), Entwicklung von Produkten (Herstellung innovativer Produkte) und Werbung für das Produkt (durch Werbung) sowie die Schaffung eines Bewusstseins für das Produkt bei den Verbrauchern. Marketing bedeutet also die Generierung von Leads oder Interessenten. Sobald das Produkt auf dem Markt ist, ist es die Aufgabe des Verkäufers, den Kunden zum Kauf des Produkts zu bewegen. Beim Verkauf geht es darum, Leads oder Interessenten in Käufe und Bestellungen umzuwandeln, während das Marketing auf längere Fristen abzielt, bezieht sich der Verkauf auf kürzere Ziele.
Jupyter for Data Science Teams
7 StundenThis instructor-led, live training in Österreich (online or onsite) introduces the idea of collaborative development in data science and demonstrates how to use Jupyter to track and participate as a team in the "life cycle of a computational idea". It walks participants through the creation of a sample data science project based on top of the Jupyter ecosystem.
By the end of this training, participants will be able to:
- Install and configure Jupyter, including the creation and integration of a team repository on Git.
- Use Jupyter features such as extensions, interactive widgets, multiuser mode and more to enable project collaboraton.
- Create, share and organize Jupyter Notebooks with team members.
- Choose from Scala, Python, R, to write and execute code against big data systems such as Apache Spark, all through the Jupyter interface.
Kaggle
14 StundenDiese von einem Dozenten geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler und -entwickler, die Data Science mit Kaggle erlernen und ihre Karriere ausbauen möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Über Datenwissenschaft und maschinelles Lernen lernen.
- Datenanalytik erforschen.
- Lernen Sie über Kaggle und wie es funktioniert.
MATLAB Fundamentals, Data Science & Report Generation
35 StundenIm ersten Teil dieser Schulung behandeln wir die Grundlagen von MATLAB und seine Funktion als Sprache und Plattform. Dazu gehört eine Einführung in die MATLAB-Syntax, Arrays und Matrizen, Datenvisualisierung, Skriptentwicklung und objektorientierte Prinzipien.
Im zweiten Teil wird gezeigt, wie MATLAB für Data Mining, maschinelles Lernen und prädiktive Analysen verwendet werden kann. Um den Teilnehmern eine klare und praktische Perspektive des Ansatzes und der Leistungsfähigkeit von MATLAB zu vermitteln, ziehen wir Vergleiche zwischen der Verwendung von MATLAB und der Verwendung anderer Tools wie Tabellenkalkulationen, C, C++ und Visual Basic.
Im dritten Teil der Schulung lernen die Teilnehmer, wie sie ihre Arbeit durch Automatisierung der Datenverarbeitung und Berichterstellung rationalisieren können.
Während des gesamten Kurses werden die Teilnehmer die erlernten Ideen durch praktische Übungen in einer Laborumgebung in die Praxis umsetzen. Am Ende des Kurses werden die Teilnehmer die Möglichkeiten von MATLAB genau kennen und in der Lage sein, sie zur Lösung realer Data-Science-Probleme sowie zur Rationalisierung ihrer Arbeit durch Automatisierung einzusetzen.
Während des gesamten Kurses werden Beurteilungen durchgeführt, um den Fortschritt zu messen.
Format des Kurses
- Der Kurs umfasst theoretische und praktische Übungen, einschließlich Falldiskussionen, Code-Beispielen und praktischer Implementierung.
Hinweis
- Die praktischen Übungen werden auf der Grundlage von vorab vereinbarten Musterdatenberichten durchgeführt. Wenn Sie spezielle Anforderungen haben, kontaktieren Sie uns bitte, um dies zu vereinbaren.
Machine Learning for Data Science with Python
21 StundenDieser von einem Trainer geleitete Live-Kurs in Österreich (online oder vor Ort) richtet sich an fortgeschrittene Datenanalysten, Entwickler oder zukünftige Data Scientists, die maschinelles Lernen in Python einsetzen möchten, um Erkenntnisse zu gewinnen, Vorhersagen zu treffen und datengesteuerte Entscheidungen zu automatisieren.
Am Ende des Kurses werden die Teilnehmer in der Lage sein:
- Die wichtigsten Paradigmen des maschinellen Lernens zu verstehen und voneinander abzugrenzen.
- Daten vorzubereiten und Metriken zur Bewertung von Modellen zu erkunden.
- Maschinelles Lernen-Algorithmus anhand realer Datenprobleme anzuwenden.
- Python-Bibliotheken und Jupyter Notebooks für die praktische Entwicklung zu nutzen.
- Modelle zur Vorhersage, Klassifizierung, Empfehlung und Clustering aufzubauen.
Accelerating Python Pandas Workflows with Modin
14 StundenDiese von einem Trainer geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler und Entwickler, die Modin verwenden möchten, um parallele Berechnungen mit Pandas für eine schnellere Datenanalyse zu erstellen und zu implementieren.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- die notwendige Umgebung einzurichten, um mit der Entwicklung von Pandas-Workflows in großem Maßstab mit Modin zu beginnen.
- die Funktionen, die Architektur und die Vorteile von Modin zu verstehen.
- Die Unterschiede zwischen Modin, Dask und Ray kennen.
- Schnellere Durchführung von Pandas-Vorgängen mit Modin.
- Implementierung der gesamten Pandas API und Funktionen.
Python Programming for Finance
35 StundenPython ist eine Programmiersprache, die in der Finanzbranche große Popularität erlangt hat. Angenommen von den größten Investmentbanken und Hedgefonds, wird es verwendet, um eine breite Palette von Finanzanwendungen aufzubauen, die von Kernhandelsprogrammen bis hin zu Risikomanagementsystemen reichen.
In diesem von Lehrern geleiteten Live-Training lernen die Teilnehmer, wie sie mit Python praktische Anwendungen zur Lösung einer Reihe spezifischer finanzbezogener Probleme entwickeln.
Am Ende dieser Schulung können die Teilnehmer:
- Die Grundlagen der Python-Programmiersprache verstehen
- Die besten Entwicklungstools zum Erstellen von Finanzanwendungen in Python herunterladen, installieren und warten
- Geeignete Python-Pakete und Programmiertechniken auswählen und nutzen, um Finanzdaten aus verschiedenen Quellen (CSV, Excel, Datenbanken, Web usw.) zu organisieren, zu visualisieren und zu analysieren
- Anwendungen entwickeln, die Probleme im Zusammenhang mit Asset Allocation, Risikoanalyse, Investment Performance und mehr lösen
- Eine Python-Anwendung beheben, integrieren, bereitstellen und optimieren
Publikum
- Entwickler
- Analysten
- Quants
Format des Kurses
- Teil Vortrag, Teil Diskussion, Übungen und intensive praktische Anwendung
Hinweis
- Dieses Training zielt darauf ab, Lösungen für einige der Hauptprobleme zu bieten, mit denen Finanzexperten konfrontiert sind. Wenn Sie jedoch ein bestimmtes Thema, Tool oder eine bestimmte Technik haben, die Sie vertiefen oder weiter ausführen möchten, kontaktieren Sie uns bitte, um dies zu vereinbaren.
Python in Data Science
35 StundenDer Trainingskurs wird den Teilnehmern helfen, sich für Web Application Development mit Python Programming mit Data Analytics vorzubereiten. Eine solche Datenvisualisierung ist ein großartiges Werkzeug für Top Management in der Entscheidungsfindung.
GPU Data Science with NVIDIA RAPIDS
14 StundenDiese von einem Dozenten geleitete Live-Schulung in Österreich (online oder vor Ort) richtet sich an Datenwissenschaftler und Entwickler, die RAPIDS nutzen möchten, um GPU-beschleunigte Datenpipelines, Workflows und Visualisierungen zu erstellen und dabei Algorithmen des maschinellen Lernens wie XGBoost, cuML usw. anzuwenden.
Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:
- Einrichten der erforderlichen Entwicklungsumgebung zur Erstellung von Datenmodellen mit NVIDIA RAPIDS.
- Die Funktionen, Komponenten und Vorteile von RAPIDS zu verstehen.
- Nutzung von GPU zur Beschleunigung von End-to-End-Daten- und Analysepipelines.
- Implementierung von GPU-beschleunigter Datenvorbereitung und ETL mit cuDF und Apache Arrow.
- Lernen Sie, wie Sie maschinelle Lernaufgaben mit XGBoost- und cuML-Algorithmen durchführen können.
- Erstellen Sie Datenvisualisierungen und führen Sie Graphanalysen mit cuXfilter und cuGraph durch.
Data Science: Analysis and Presentation
7 StundenDie integrierte Umgebung des Wolfram-Systems macht es zu einem effizienten Werkzeug sowohl für die Analyse als auch für die Präsentation von Daten. Dieser Kurs behandelt Aspekte der Wolfram-Sprache, die für die Analyse relevant sind, einschließlich statistischer Berechnungen, Visualisierung, Datenimport und -export und automatische Erstellung von Berichten.