Principais funções de interação e mecanismos de comutação
O cliente Xiaozhi oferece duas funções principais de interação:
- interação de voz em tempo realReconhecimento e síntese de fala por meio da tecnologia WebSocket, com suporte para cancelamento de eco, interrupção de voz (acionada por palavras de comando, como "stop") e filtragem de ruído ambiente.
- sistema de diálogo baseado em textoMecanismo assíncrono de processamento de mensagens para dar suporte a várias rodadas de diálogo e manutenção de contexto para problemas complexos
Há dois tipos de comutação:
- Comutação proativaInterface principal: A interface principal exibe um ícone de microfone e uma caixa de entrada, permitindo que o usuário escolha como interagir a qualquer momento.
- modelo híbridoResposta de texto: Depois de fazer uma pergunta por voz, você pode visualizar uma resposta de texto ou acionar uma mudança usando o comando de voz "mudar para entrada de texto". O sistema lembra o método de interação padrão preferido do usuário nas configurações.
Essa resposta foi extraída do artigoXiaozhi MCP Client: um assistente de IA multiplataforma com suporte à interação de voz e textoO