Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung Schulung

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung ist ein praxisorientierter Kurs zum zuverlässigen Skalieren von Tencent Hunyuan-Modellen.

Diese von Instruktoren geleitete Live-Veranstaltung (online oder vor Ort) richtet sich an Ingenieure und Architekten auf fortgeschrittenem Niveau, die Tencent Hunyuan nutzen möchten, um große Modelle sowie MoE-Modelle (Mixture of Experts) mit geringerer Latenz, besserer GPU-Auslastung und kontrollierten Betriebskosten bereitzustellen.

Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:

die Hauptherausforderungen bei der Produktionsserving von Tencent Hunyuan-Modellen zu erläutern.
praktische Techniken zur Optimierung der Inferenz anzuwenden, wie TensorRT, KV-Cache-Tuning, Quantisierung und Batching.
einen skalierbaren Bereitstellungsansatz mit automatischer Skalierung, Monitoring und Kapazitätsplanung zu entwerfen.
die Trade-offs zwischen Latenz und Kosten für reale Produktionsworkloads zu verbessern.

Kursformat

Interaktiver Vortrag und Diskussion.
Zahlreiche Übungen und Praxisbeispiele.
Praktische Implementierung in einer Live-Lab-Umgebung.

Optionen zur Kursanpassung

Um eine maßgeschneiderte Schulung für diesen Kurs anzufordern, kontaktieren Sie uns bitte, um die Details zu vereinbaren.

Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.

Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.

Kommende Kurse

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

2026-06-17 09:30

14 Stunden

NobleProg Linz

3472 EUR (Online)

3972 EUR (Schulungsraum)

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

2026-07-01 09:30

14 Stunden

Salzburg

3472 EUR (Online)

3972 EUR (Schulungsraum)

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

2026-07-15 09:30

14 Stunden

NobleProg Innsbruck

3472 EUR (Online)

3972 EUR (Schulungsraum)

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

2026-07-29 09:30

14 Stunden

NobleProg Graz

3472 EUR (Online)

3972 EUR (Schulungsraum)

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

2026-08-12 09:30

14 Stunden

NobleProg Wien

3472 EUR (Online)

3972 EUR (Schulungsraum)

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

2026-08-26 09:30

14 Stunden

NobleProg Linz

3472 EUR (Online)

3972 EUR (Schulungsraum)

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung Schulung

Schulungsübersicht

Voraussetzungen

Kommende Kurse

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Verwandte Kategorien

Diese Seite in anderen Ländern/Regionen

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung Schulung

Schulungsübersicht

Voraussetzungen

Kommende Kurse

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Einsatz von Tencent Hunyuan in der Produktion: Inference mit niedriger Latenz und Kostenoptimierung

Kombinierte Kurse

Erweiterte LangGraph: Optimierung, Debugging und Überwachung komplexer Graphen

Entwicklung von Coding Agents mit Devstral: Von der Agentendesign bis zur Tooling

Open-Source Model Ops: Selbsthosting, Feintuning und Governance mit Devstral & Mistral Modellen

LangGraph-Anwendungen in der Finanzwelt

LangGraph Grundlagen: Graphbasierte LLM-Prompting und -Kettenierung

LangGraph in der Gesundheitsversorgung: Workflow-Orchestrierung für regulierte Umgebungen

LangGraph für Anwendungen im Rechtswesen

Erstellen dynamischer Workflows mit LangGraph und LLM-Agents

LangGraph für Marketing-Automatisierung

Le Chat Enterprise: Private ChatOps, Integrations & Admin Controls

Kostenwirksame LLM-Architekturen: Mistral im großen Maßstab (Leistungs- und Kostenoptimierung)

Produktisierung von Konversationsassistenten mit Mistral-Connectoren und -Integrationen

Enterprise-Grade Deployments with Mistral Medium 3

Mistral für verantwortungsbewusste KI: Datenschutz, Datensouveränität und Unternehmenskontrollen

Multimodale Anwendungen mit Mistral-Modellen (Vision, OCR & Dokumentverarbeitung)

Verwandte Kategorien

Large Language Models (LLMs)

Diese Seite in anderen Ländern/Regionen

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites