AI-Chatbox的核心功能主要包括:
- 语音唤醒与命令识别:支持通过唤醒词“hi, 乐鑫”和命令词“我有个问题”触发录音。
- 语音转文字:利用Vosk工具将录制的WAV音频转换为文字,支持中文识别。
- 大模型交互:通过DeepSeek API发送文字问题并获取智能回答。
- 日志记录:实时记录设备状态、识别结果和LLM回答,便于调试。
- 跨设备访问:通过Flask搭建REST服务,允许局域网内其他设备调用语音转文字功能。
- 嵌入式优化:使用Rust语言开发,针对ESP32S3硬件优化,配置512最大生成token以平衡性能与资源。
本答案来源于文章《AI-Chatbox:基于ESP32S3的语音转文字智能对话项目》