已公布的开发计划
根据项目文档和开发者访谈,未来半年将重点推进:
- 语言扩展:2024年Q3前完成法语/日语支持,Q4上线中文普通话和韩语
- 情感引擎:加入愤怒、悲伤等8种情感参数控制(beta版已内部测试)
- 硬件加速:针对NVIDIA Tensor Core和Intel OpenVINO的专属优化
社区驱动功能
开源社区正在讨论的功能提案包括:
- 方言支持:粤语、关西日语等地区变体
- 声纹克隆:允许用户上传样本语音进行特征提取
- 云端协同:本地模型与云端大模型的混合推理方案
生态建设
计划建立语音风格市场(Voice Marketplace),允许开发者:
- 分享自定义训练的声音模型
- 商业化出售专业配音包
- 通过插件系统扩展音效处理能力
本答案来源于文章《Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择》