MLX-Audio提供了简单易用的命令行接口进行文本转语音(TTS)操作:
基础用法:
- 基本命令格式:
python -m mlx_audio.tts.generate --text '你的文本'
- 指定输出文件:
--output 'output.wav'
进阶功能:
- 使用不同语音模型:
--model 'model_name'
- 从文件读取长文本:
--file 'text.txt'
- 调整语音参数:如语速(–speed)和音调(–pitch)
使用示例:
- 简单测试:
python -m mlx_audio.tts.generate --text '测试语音生成'
- 保存输出:
python -m mlx_audio.tts.generate --text '欢迎使用' --output welcome.wav
- 批量处理:可以编写Python脚本循环处理多个文本
性能提示:
- 在M系列芯片上运行可获得最佳性能
- 处理长文本时建议分段处理
- 确保系统有足够内存资源
本答案来源于文章《MLX-Audio:基于 Apple MLX 框架的文本转语音工具》