Derzeitige Position:Abb. Anfang " AI-Antworten

Die Hardware-Optimierung von realtime-transcription-fastrtc sorgt für einen reibungslosen Ablauf.

2025-08-25

1.4 K

Hardware-Konfiguration und Strategien zur Leistungsoptimierung

realtime-transcription-fastrtc bietet ein mehrstufiges Hardware-Optimierungsschema:

GPU-Beschleunigung: Volle Unterstützung für CUDA und MPS (Metal Performance Shaders), empfohlen für die Verwendung mit NVIDIA-Grafikkarten.
Modellauswahl: Fünf vortrainierte Modelle von flüstern-klein (39M Parameter) bis flüstern-groß (1550M Parameter) stehen zur Verfügung.
Leistungsoptimierung: Unterstützung für die Anpassung des Parameters batch_size zum Ausgleich von Latenz und Durchsatz

Spezifische Empfehlungen für verschiedene Hardware-Konfigurationen:

High-End-Geräte: empfohlenes Modell whisper-large-v3-turbo, batch_size auf 32 gesetzt
Mittelklasse-Geräte: Flüster-Medium-Modell empfohlen, batch_size auf 8 gesetzt
Geräte mit geringem Volumen: Verwenden Sie das flüsterwinzige Modell mit ausgeschaltetem VAD

Der Mechanismus zum Aufwärmen des Modells beim ersten Durchlauf verringert die Latenzzeit der nachfolgenden Erkennungen wirksam.