Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Wie lässt sich die DeepSeek-R1 WebGPU-Inferenzgeschwindigkeit lokal optimieren?

2025-09-10 3.3 K

Methodik der Leistungsoptimierung

Die Reaktionsfähigkeit des Modells hängt von der GPU-Leistung des Geräts und der Ressourcenzuweisung des Browsers ab und kann auf folgende Weise verbessert werden:

Leitfaden für den Betrieb

  • Konfiguration der Hardware-BeschleunigungChrome-Einstellungen→System→Aktivieren Sie "Hardware-Beschleunigung verwenden".
  • Festlegung von RessourcenprioritätenWebGPU-Prozess im Browser-Taskmanager auf hohe Priorität setzen (Umschalt+Esc)
  • Optimierung der Berechnungsparametermax_new_tokens: Den Wert des Parameters max_new_tokens reduzieren (kann in zukünftigen Versionen offen sein)
  • Programm zur Isolierung der UmweltSchließen Sie andere Webseiten/Plug-ins, die GPU-Ressourcen verbrauchen.

Fortgeschrittenes Programm

Entwickler können die Angabe eines GPU-Geräts erzwingen, indem sie die devicePreference in der transformers.js-Konfiguration ändern, oder OffscreenCanvas für das Hintergrund-Rendering verwenden.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang