核となる相互作用機能とスイッチング・メカニズム
Xiaozhiクライアントは2つのコアインタラクション機能を提供する:
- リアルタイム音声対話WebSocket技術による音声認識と合成。エコーキャンセル、音声割り込み("stop "などのコマンドワードでトリガー)、アンビエント・ノイズ・フィルタリングをサポート。
- テキストベース対話システム複雑な問題に対する複数回の対話とコンテキスト維持をサポートする非同期メッセージ処理メカニズム
スイッチングには2種類ある:
- プロアクティブ・スイッチングメイン・インターフェースには、マイクのアイコンと入力ボックスの両方が表示され、ユーザーはいつでもインタラクションの方法を選択することができます。
- ハイブリッドモデル音声で質問した後、「テキスト入力に切り替える」という音声コマンドを使用することで、テキストの返信を表示したり、切り替えをトリガーしたりすることができます。システムは、ユーザーの好みのデフォルトの対話方法を設定で記憶しています。
この答えは記事から得たものである。Xiaozhi MCP Client:音声とテキストによる対話をサポートするクロスプラットフォームAIアシスタントについて