Hardware-Konfiguration und Strategien zur Leistungsoptimierung
realtime-transcription-fastrtc bietet ein mehrstufiges Hardware-Optimierungsschema:
- GPU-Beschleunigung: Volle Unterstützung für CUDA und MPS (Metal Performance Shaders), empfohlen für die Verwendung mit NVIDIA-Grafikkarten.
- Modellauswahl: Fünf vortrainierte Modelle von flüstern-klein (39M Parameter) bis flüstern-groß (1550M Parameter) stehen zur Verfügung.
- Leistungsoptimierung: Unterstützung für die Anpassung des Parameters batch_size zum Ausgleich von Latenz und Durchsatz
Spezifische Empfehlungen für verschiedene Hardware-Konfigurationen:
- High-End-Geräte: empfohlenes Modell whisper-large-v3-turbo, batch_size auf 32 gesetzt
- Mittelklasse-Geräte: Flüster-Medium-Modell empfohlen, batch_size auf 8 gesetzt
- Geräte mit geringem Volumen: Verwenden Sie das flüsterwinzige Modell mit ausgeschaltetem VAD
Der Mechanismus zum Aufwärmen des Modells beim ersten Durchlauf verringert die Latenzzeit der nachfolgenden Erkennungen wirksam.
Diese Antwort stammt aus dem ArtikelOpen-Source-Tool für Sprache in Text in EchtzeitDie