Esquema de otimização de latência para o ESP32S3:
camada de hardware
- Processamento de áudio com a biblioteca de aceleração ESP-DSP incorporada à placa de desenvolvimento XIAO ESP32S3 Sense
- Aumente a configuração da PSRAM para 8 MB com
cargo espflash flash --flash-size 8mb
Gravação de firmware
camada de software
- existir
vosk_server.py
configurar--threads=2
Ativação da análise multi-threaded - Usando a função
tokio
Processamento assíncrono de solicitações de rede em tempo de execução - Desativar a saída de registro não essencial (modificação)
log_level = warn
)
Otimização de processos
Usando o reconhecimento de fluxo de fala, ao detectarwn9_hilexin
Estabelece imediatamente a conexão longa API após a palavra de ativação, reduzindo o tempo de inicialização a frio em cerca de 300 ms
Essa resposta foi extraída do artigoAI-Chatbox: projeto de diálogo inteligente de fala para texto baseado no ESP32S3O