Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Grundlagen der Audio-Klassifizierung
- Art von Klangereignissen: Umgebungs-, mechanische, menschengenerierte
- Übersicht über Anwendungsfälle: Überwachung, Monitoring, Automatisierung
- AUDIO-KLASSIFIZIERUNG GEGENÜBER DETECTION UND SEGMENTATION
Audio-Daten und Merkmalsextraktion
- Arten von Audio-Dateien und Formate
- Abtastrate, Fensterung, Überlegungen zur Rahmengröße
- Ausschöpfen von MFCCs, Chroma-Merkmalen, Mel-Spektrogrammen
Datenvorbereitung und Annotation
- UrbanSound8K, ESC-50 und benutzerdefinierte Datensätze
- Kennzeichnung von Klangereignissen und zeitlichen Grenzen
- Balancieren der Datensätze und Erweiterung des Audios
Erstellen von Audio-Klassifikationsmodellen
- Nutzung von konvolutionalen neuronalen Netzwerken (CNNs) für Audio
- Modell-Eingabe: Rohwelle gegen Merkmale
- Verlustfunktionen, Bewertungsmaße und Überanpassung
Ereigniserkennung und Temporale Lokalisierung
- Rahmenbasierte und Segment-basierte Erkennungsstrategien
- Post-Processing von Ermittlungen mit Schwellenwerten und Glättung
- Vorisualisierung der Vorhersagen auf Audio-Zeitleisten
Erweiterte Themen und Echtzeitverarbeitung
- Weiteres Lernen für niedrige Daten-Szenarien
- Bereitstellung von Modellen mit TensorFlow Lite oder ONNX
- Streaming-Audio-Verarbeitung und Latenzüberlegungen
Projektentwicklung und Anwendungsszenarien
- Entwurf eines kompletten Pipelines: von der Aufnahme bis zur Klassifizierung
- Erstellen eines Beweisbegriffs für Überwachung, Qualitätskontrolle oder Monitoring
- Logging, Alarmierung und Integration mit Dashboards oder APIs
Zusammenfassung und nächste Schritte
Voraussetzungen
- Eine Verständnis von Machine-Learning-Konzepten und Modellausbildung
- Erfahrung mit Python Programmierung und Datenvorbereitung
- Vertrautheit mit den Grundlagen der digitalen Audio-Technik
Zielpublikum
- Datenwissenschaftler
- Machine-Learning-Ingenieure
- Forscher und Entwickler in der Audiosignalverarbeitung
21 Stunden