認知の遅れは通常、3つの要因によって引き起こされる:
- モデル搭載段階大きなモデル(例えば300MBのフランスのモデル)はダウンロードと解凍に時間がかかる。
- ハードウェア性能低コストのデバイスでは、WebAssemblyの計算が遅くなる可能性があります。
- オーディオ・バッファの設定: createTransfererのバッファサイズ(デフォルトは128*150)は応答速度に影響する。
最適化プログラム::
- ローディング戦略:
- Service Workerでモデルをプリロードする
- 小型モデルの選択(例:vosk-model-small-en-us-0.15) - パラメータ調整:
- サンプルレートを16000Hzに変更(mod.confの同期調整が必要)
- 送信バッファを64*150に削減 - ランタイムの最適化:
- WebGLアクセラレーションを有効にする(mfcc.confの変更が必要)
- 不要な結果イベントリスナーをオフにする
テストによると、最適化された英語認識の待ち時間は、1.2秒から約400ミリ秒に短縮された。
この答えは記事から得たものである。Vosk-Browser:ブラウザ上で動作する音声認識ツールについて
































