核心交互功能与切换机制
小智客户端提供两大核心交互功能:
- 实时语音交互:通过WebSocket技术实现语音识别与合成,支持回音消除、语音打断(通过”停止”等指令词触发)和环境噪音过滤
- 文字对话系统:采用异步消息处理机制,支持复杂问题的多轮对话和上下文保持
切换方式分为两种:
- 主动切换:主界面同时显示麦克风图标和输入框,用户可随时选择交互方式
- 混合模式:语音提问后可查看文字回复,或通过语音指令”转为文字输入”触发切换。系统会在设置中记忆用户偏好的默认交互方式。
本答案来源于文章《小智MCP客户端:支持语音和文字交互的跨平台AI助手》