実施の背景
Dolphinは、異なるハードウェア条件に適応するために2つのモデルを提供しています。
統合ソリューション
- ハードウェア適応::
設備タイプ 推薦モデル メモリーフットプリント ラズベリーパイ4B ベース <500MB未満 ジェットソン・ナノ 小さい <1.2GB - 最適化のヒント::
- モデルをメモリにプリロードする
model = dolphin.load_model("base", "/models/", "cpu") - ストリーミングを有効にする(コード例はGitHubのstreamingブランチを参照)
- モデルをメモリにプリロードする
レイテンシーコントロール
3段階の最適化
1. オーディオキャプチャ16kHzサンプルレート+モノラル使用
2. セグメンテーションVADセグメンテーションのしきい値を300msに設定
3. 結果キャッシュ直近5秒間の音声のリングバッファの実装
この答えは記事から得たものである。ドルフィン:アジア言語認識とアジア言語のための音声テキストモデルについて




























