csm-mlx 是一个基于苹果 MLX 框架的语音生成模型,专门为 Apple Silicon 芯片(如 M1、M2)优化设计的工具。其主要功能包括:
- 语音生成:可以将输入的文本转换为自然的人声音频
- 对话上下文支持:能够根据之前的对话内容生成连贯的语音回复
- 苹果设备优化:充分利用苹果芯片的性能优势
- 开源模型支持:可以加载 Hugging Face 上的预训练模型
- 参数可调:允许调整诸如温度(temp)和最小概率(min_p)等参数控制生成效果
该项目由开发者 senstella 在 2025 年 3 月发布,目标是让语音生成技术在苹果设备上更高效、易用。
本答案来源于文章《csm-mlx:苹果设备专用的 csm 语音生成模型》