Schulungsübersicht
Übersicht über Python Pakete im Zusammenhang mit NLP
Einführung in NLP (Beispiele natürlich in Python)
Einfache Textmanipulation, Text durchsuchen, Words zählen, Texte in Words aufteilen, lexikalische Streuung
Komplexe Strukturen verarbeiten. Texte in Listen darstellen
IndizierungslistenKollokationenBigrammeHäufigkeitsverteilungenKonditionale mit WordsVergleichen von Words (beginnt mit, endet mit, islower, isalpha usw.)Verständnis natürlicher Sprache Word SinnesdisambiguierungPronomenauflösung
Maschinelle Übersetzungen (statistisch, regelbasiert, wörtlich usw.)ÜbungenNLP in Python in Beispielen
Zugriff auf Textkorpora und lexikalische Ressourcen. Gemeinsame Quellen für Korpora. Bedingte Häufigkeitsverteilungen. Zählen von Words nach Genre. Erstellen eines eigenen Korpus. Aussprachewörterbuch. Schuhkarton und Werkzeugkasten. Lexika. Sinne und Synonyme. Hierarchien. Lexikalische Beziehungen: Meronyme, Holonyme. Semantische ÄhnlichkeitVerarbeitung von RohtextdruckenStrukturieren
Teile einer Zeichenfolge extrahieren
AccessEinzelne Charaktere erstellen
SearchErsetzen, Ersetzen, Teilen, Verbinden, Indizieren usw.Verwendung regulärer AusdrückeWortmuster erkennenStemmenTokenisierungNormalisierung von TextWord Segmentierung (insbesondere auf Chinesisch)Kategorisieren und Taggen von Words getaggten KorporaMarkierte TokenWortart-TagsetPython WörterbücherWords-zu-Propertieis-Zuordnung
Automatisches TaggingBestimmung der Kategorie eines Word (morphologisch, syntaktisch, semantisch)Textklassifizierung (Machine Learning) Überwachte KlassifizierungSatzsegmentierungKreuzvalidierungEntscheidungsbäumeExtrahieren von Informationen aus Text ChunkingGeklirrt
Tags vs. BäumeAnalyse der kontextfreien Grammatik der SatzstrukturParserErstellen merkmalsbasierter Grammatiken. Grammatische MerkmaleVerarbeitung von Merkmalsstrukturen
Analyse der Bedeutung von Sätzen, Semantik und LogikAussagelogikLogik erster OrdnungDiskurssemantik
Verwalten linguistischer Datenformate (Lexikon vs. Text)Metadaten
Voraussetzungen
Grundkenntnisse über Python