スマートデバイスに低遅延の音声コントロールを実装するには？

2025-08-25

1.4 K

実施の背景

Dolphinは、異なるハードウェア条件に適応するために2つのモデルを提供しています。

ハードウェア適応::

設備タイプ推薦モデルメモリーフットプリント

ラズベリーパイ4B ベース <500MB未満

ジェットソン・ナノ小さい <1.2GB
最適化のヒント::
1. モデルをメモリにプリロードする
```
model = dolphin.load_model("base", "/models/", "cpu")
```
2. ストリーミングを有効にする（コード例はGitHubのstreamingブランチを参照）

設備タイプ	推薦モデル	メモリーフットプリント
ラズベリーパイ4B	ベース	<500MB未満
ジェットソン・ナノ	小さい	<1.2GB

3段階の最適化
1. オーディオキャプチャ16kHzサンプルレート＋モノラル使用
2. セグメンテーションVADセグメンテーションのしきい値を300msに設定
3. 結果キャッシュ直近5秒間の音声のリングバッファの実装