海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

xiaozhi-esp32-server支持哪些语言模型和语音合成方案?

2025-08-29 2.3 K

该项目采用模块化设计,支持主流AI服务的灵活切换:

语言模型支持

  • 默认方案:ChatGLM大语言模型
  • 替代选项:阿里百炼、DeepSeek等国内主流模型
  • 配置方式:通过修改config.yaml中的model_provider参数实现切换

语音合成(TTS)方案

  • 基础方案:Microsoft EdgeTTS(默认启用)
  • 增强方案:火山引擎TTS,提供更自然的语音输出
  • 技术依赖:需预先安装libopus和ffmpeg组件保证音频处理能力

实际部署时,用户可根据硬件性能和网络条件选择合适的组合。例如对实时性要求高的场景推荐使用DeepSeek+EdgeTTS组合,而需要高质量语音输出的场景可选择ChatGLM+火山引擎TTS。所有切换操作都在配置文件完成,无需修改核心代码。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文