Schulungsübersicht
I. Einleitung und Vorbemerkungen
1. Überblick
- R freundlicher machen, R und verfügbare GUIs
- Rstudio
- Verwandte Software und Dokumentation
- R und Statistik
- R interaktiv verwenden
- Eine einführende Sitzung
- Hilfe zu Funktionen und Merkmalen
- R-Befehle, Groß- und Kleinschreibung, etc.
- Aufrufen und Korrigieren von vorherigen Befehlen
- Ausführen von Befehlen aus einer Datei oder Umleiten der Ausgabe in eine Datei
- Datenpermanenz und Entfernen von Objekten
- Good Programmierpraxis: In sich geschlossene Skripte, gute Lesbarkeit z.B. strukturierte Skripte, Dokumentation, Markdown
- Installieren von Paketen; CRAN und Bioconductor
2. Lesen von Daten
- Txt-Dateien (read.delim)
- CSV-Dateien
3. Einfache Manipulationen; Zahlen und Vektoren + Arrays
- Vektoren und Zuweisung
- Vektorielle Arithmetik
- Erzeugen von regulären Sequenzen
- Logische Vektoren
- Fehlende Werte
- Zeichen-Vektoren
- Indexvektoren; Auswählen und Ändern von Teilmengen eines Datensatzes
- Arrays
- Indizierung von Arrays. Unterabschnitte eines Arrays
- Index-Matrizen
- Die Funktion array() + einfache Operationen auf Arrays, z.B. Multiplikation, Transposition
- Andere Arten von Objekten
4. Listen und Datenrahmen
- Listen
- Erstellen und Ändern von Listen
- Verkettung von Listen
- Datenrahmen
- Erstellen von Datenrahmen
- Arbeiten mit Datenrahmen
- Anhängen beliebiger Listen
- Verwalten des Suchpfads
5. Datenmanipulation
- Auswahl, Unterteilung von Beobachtungen und Variablen
- Filtern, Gruppieren
- Umkodierung, Transformationen
- Aggregation, Kombination von Datensätzen
- Bilden von partitionierten Matrizen, cbind() und rbind()
- Die Verkettungsfunktion (), mit Arrays
- Zeichenmanipulation, stringr-Paket
- Kurze Einführung in grep und regexpr
6. Mehr über das Lesen von Daten
- XLS-, XLSX-Dateien
- readr und readxl Pakete
- SPSS, SAS, Stata,... und andere Datenformate
- Exportieren von Daten in txt, csv und andere Formate
6. Gruppierung, Schleifen und bedingte Ausführung
- Gruppierte Ausdrücke
- Kontrollanweisungen
- Bedingte Ausführung: if-Anweisungen
- Wiederholte Ausführung: for-Schleifen, repeat und while
- Einführung in apply, lapply, sapply, tapply
7. Funktionen
- Erstellen von Funktionen
- Optionale Argumente und Standardwerte
- Variable Anzahl von Argumenten
- Umfang und seine Folgen
8. Einfache Grafiken in R
- Erstellen einer Grafik
- Density Plots
- Punktdiagramme
- Balkendiagramme
- Liniendiagramme
- Tortendiagramme
- Boxplots
- Streudiagramme
- Kombinierte Diagramme
II. Statistische Analyse in R
1. Wahrscheinlichkeitsverteilungen
- R als eine Reihe von statistischen Tabellen
- Untersuchung der Verteilung eines Datensatzes
2. Testen von Hypothesen
- Tests über einen Populationsmittelwert
- Likelihood-Ratio-Test
- Tests mit einer und zwei Stichproben
- Chi-Quadrat-Test Goodness-of-Fit-Test
- Kolmogorov-Smirnov-Ein-Stichproben-Statistik
- Wilcoxon Signed-Rank-Test
- Zwei-Stichproben-Test
- Wilcoxon-Rangsummen-Test
- Mann-Whitney-Test
- Kolmogorov-Smirnov-Test
3. Mehrfache Prüfung von Hypothesen
- Typ-I-Fehler und FDR
- ROC-Kurven und AUC
- Mehrfache Testverfahren (BH, Bonferroni usw.)
4. Lineare Regressionsmodelle
- Allgemeine Funktionen zur Extraktion von Modellinformationen
- Aktualisierung der angepassten Modelle
- Verallgemeinerte lineare Modelle
- Familien
- Die Funktion glm()
- Klassifizierung
- Logistische Regression
- Lineare Diskriminanzanalyse
- Unüberwachtes Lernen
- Hauptkomponentenanalyse
- Clustering-Methoden (k-means, hierarchisches Clustering, k-medoids)
5. Überlebensanalyse (Survival-Paket)
- Überlebensobjekte in r
- Kaplan-Meier-Schätzung, Log-Rank-Test, parametrische Regression
- Konfidenzbänder
- Analyse zensierter (intervallzensierter) Daten
- Cox-PH-Modelle, konstante Kovariaten
- Cox-PH-Modelle, zeitabhängige Kovariaten
- Simulation: Modellvergleich (Vergleich von Regressionsmodellen)
6. Analyse der Varianz
- Einfaktorielle ANOVA
- Zweifache Klassifizierung der ANOVA
- MANOVA
III. Bearbeitete Probleme in der Bioinformatik
- Kurze Einführung in das Limma-Paket
- Arbeitsablauf der Microarray-Datenanalyse
- Herunterladen von Daten aus GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Datenverarbeitung (QC, Normalisierung, differentielle Expression)
- Vulkan-Plot
- Custering Beispiele + Heatmaps
Erfahrungsberichte (5)
wie der Trainer sein Wissen im Unterrichtsthema zeigt
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Kurs - Data Vault: Building a Scalable Data Warehouse
Maschinelle Übersetzung
Offene Diskussion mit dem Trainer
Tomek Danowski - GE Medical Systems Polska Sp. Z O.O.
Kurs - Process Mining
Maschinelle Übersetzung
Sehr nützlich, weil es mir hilft zu verstehen, was wir mit den Daten in unserem Kontext tun können. Es wird mich auch dabei unterstützen
Nicolas NEMORIN - Adecco Groupe France
Kurs - KNIME Analytics Platform for BI
Maschinelle Übersetzung
Ich habe die Übungen mit der Hand-zu-Hand-Methode wirklich genossen.
Yunfa Zhu - Environmental and Climate Change Canada
Kurs - Foundation R
Maschinelle Übersetzung
Das Tempo war genau richtig und die entspannte Atmosphäre ließ die Kandidaten zuversichtlich Fragen stellen.
Rhian Hughes - Public Health Wales NHS Trust
Kurs - Introduction to Data Visualization with Tidyverse and R
Maschinelle Übersetzung