ESP32S3のレイテンシ最適化スキーム:
ハードウェア層
- XIAO ESP32S3センス開発ボードに組み込まれたESP-DSPアクセラレーションライブラリでオーディオを処理
- PSRAMの構成を8MBに増やす
cargo espflash flash --flash-size 8mb
ファームウェアの書き込み
ソフトウェア層
- ある
vosk_server.py
セットアップ--threads=2
マルチスレッド解析の有効化 - Rustの
tokio
ネットワークリクエストの非同期ランタイム処理 - 必要でないログ出力をオフにする(修正)
log_level = warn
)
プロセスの最適化
音声ストリーミング認識を使ってwn9_hilexin
ウェイクアップワード後、直ちにAPIロングコネクションを確立し、コールドスタート時間を約300ms短縮
この答えは記事から得たものである。AI-Chatbox:ESP32S3ベースの音声テキストインテリジェント対話プロジェクトについて