服务器响应速度优化方案
针对 xiaozhi-esp32-server 的延迟问题,可实施四级优化策略:
- 模型层优化::
- 将默认 ChatGLM 替换为轻量级模型(如修改 config.yaml 中 llm_model 为 AliLLM)
- 关闭非必要功能模块(如关闭记忆模式或无用的 TTS 引擎)
- 硬件资源配置::
- 确保设备内存 ≥ 4GB(基础需求 2GB+2GB 交换空间)
- 为 Python 进程设置 CPU 亲和性:
taskset -c 0,1 python main.py
- 网络层调优::
- 使用有线网络连接替代 WiFi
- 设置 WebSocket 心跳间隔为 30 秒(修改 ws_heartbeat 参数)
- 性能测试与监控::
- 定期运行 performance_tester.py 脚本(建议基准值:<500ms/请求)
- 通过 –profile 参数启动服务生成性能日志:
python main.py --profile
实施后通常可将响应时间从平均 2 秒降至 0.8 秒内。特别注意:语音识别和 TTS 合成属于计算密集型任务,建议在边缘设备单独部署这些模块。
Essa resposta foi extraída do artigoxiaozhi-esp32-server: serviço de back-end de código aberto do chatbot de IA da XiaozhiO