Derzeitige Position:Abb. Anfang " AI-Antworten

Wie kann ich die Leistung von Dia auf weniger leistungsfähigen Geräten optimieren?

2025-08-24

1.5 K

Leistungsoptimierungsprogramm für Flachbaugeräte

Die folgenden Optimierungsstrategien können für Geräte mit unzureichender GPU-Leistung oder begrenztem Speicher verwendet werden:

ParametrisierungVerringern Sie den Wert von -max-tokens (Standardwert 3072), um die Generierungslänge zu verkürzen und die Rechenlast erheblich zu verringern.
ChargeLange Dialoge in mehrere kurze Segmente aufteilen, um sie separat zu generieren, und schließlich zusammenfügen.
Quantifizierung der ModellierungFP16-Präzision verwenden, um die Nutzung des Videospeichers zu reduzieren (dtype-Einstellung in config.yaml muss geändert werden)
Offline-VerarbeitungVorerstellung von Kernmaterial auf Cloud-Diensten, nur lokale, leichtgewichtige Verarbeitung

Spezifische operative Leitlinien:

Änderung des Skripts cli.py, um eine Logik zur Speicherüberwachung hinzuzufügen
Setzen Sie die Anzahl der uvicorn-Arbeitsprozesse auf 1 (-workers 1)
Aktivieren des Gradienten-Checkpoints in config.yaml (gradient_checkpointing: true)

Hinweis: Nari Labs hat angekündigt, dass eine CPU-optimierte Version verfügbar sein wird. Behalten Sie GitHub für Updates im Auge.