Optimierte Lösung für den Einsatz von Edge-Geräten
PengChengStarling bietet eine speziell optimierte Lösung für ressourcenbeschränkte Edge-Geräte (z. B. intelligente Lautsprecher, industrielle Steuerungen usw.) mit einem kompakten Modelldesign, das den Verbrauch von Rechenressourcen erheblich reduziert.
Matrix für die Einsatzstrategie:
| Art der Ausrüstung | empfohlenes Format | Tipps zur Optimierung |
|---|---|---|
| High-End-Edge-Geräte | PyTorch Einheimisch | Ermöglichung quantitativen Denkens |
| Mittelklasse eingebettet | ONNX-Laufzeit | Quantifizierung mit INT8 |
| Low-End IoT | TensorRT | Modellbereinigung + Quantifizierung |
Spezifische Umsetzungsschritte:
- Modellumwandlung::
- ONNX-Format exportieren:
python export_onnx.py - Die Umsetzung wird quantifiziert:
python quantize.py
- ONNX-Format exportieren:
- Laufzeitoptimierung::
- Ermöglichung von Multithreading
- Einstellung der richtigen Losgröße
- Nutzen Sie die Vorteile der Hardware-Beschleunigungsfunktionen
- Leistungsüberwachung::
- Verfolgung der Speichernutzung
- Messung der Ende-zu-Ende-Verzögerung
- CPU/GPU-Auslastung überwachen
Nach der Optimierung kann die Erkennung auf dem Raspberry Pi 4B in Echtzeit erfolgen (Echtzeitrate < 0,5), und die Speicherbelegung kann auf 500 MB begrenzt werden, was für die meisten Edge-Computing-Szenarien geeignet ist.
Diese Antwort stammt aus dem ArtikelPengChengStarling: Kleineres und schnelleres mehrsprachiges Speech-to-Text-Tool als Whisper-Large v3Die































