Os principais recursos do AI-Chatbox incluem, principalmente:
- Ativação por voz e reconhecimento de comandosGravação: Suporta a gravação acionada pela palavra de despertar "hi, Lexin" e pela palavra de comando "I have a question".
- conversão de voz em textoConversão de áudio WAV gravado em texto usando a ferramenta Vosk, que oferece suporte ao reconhecimento de chinês.
- Interação de modelos grandesEnvie perguntas de texto e obtenha respostas inteligentes por meio da API do DeepSeek.
- Registro em logRegistro em tempo real do status do dispositivo, dos resultados de reconhecimento e das respostas do LLM para facilitar a depuração.
- acesso entre dispositivosCrie um serviço REST por meio do Flask para permitir que outros dispositivos na LAN chamem a função de fala para texto.
- Otimização incorporadaDesenvolvido em Rust, otimizado para o hardware ESP32S3, configurado com 512 tokens gerados no máximo para equilibrar o desempenho e os recursos.
Essa resposta foi extraída do artigoAI-Chatbox: projeto de diálogo inteligente de fala para texto baseado no ESP32S3O