Suporte técnico essencial para interação em tempo real
O cliente Xiaozhi usa o protocolo WebSocket como base para a comunicação em tempo real, uma tecnologia que tem vantagens significativas sobre o protocolo HTTP tradicional em termos de latência e taxa de transferência. O canal de comunicação full-duplex estabelecido por meio do WebSocket é capaz de manter de forma estável uma conexão persistente entre o cliente e o servidor, o que é fundamental para a interação em tempo real de voz e texto.
Em termos de funcionalidade de voz, o cliente implementa duas tecnologias principais, cancelamento de eco e interrupção de voz, para manter boas taxas de reconhecimento mesmo em ambientes ruidosos. O sistema de diálogo de texto oferece suporte à entrada rápida e ao gerenciamento complexo de sessões, além de permitir que os usuários alternem perfeitamente entre os modos de voz e texto. Essa interação híbrida enriquece muito a experiência do usuário, permitindo que ele escolha o método de comunicação mais adequado para diferentes cenários.
Essa resposta foi extraída do artigoXiaozhi MCP Client: um assistente de IA multiplataforma com suporte à interação de voz e textoO