安装步骤
- 克隆项目仓库:
git clone https://github.com/yangb05/PengChengStarling cd PengChengStarling
- 安装依赖:
pip install -r requirements.txt export PYTHONPATH=/tmp/PengChengStarling:$PYTHONPATH
使用流程
数据准备
运行prepare.py脚本适配数据格式,生成data.list文件和相关特征。
模型训练
- 配置config_train目录中的参数
- 执行训练命令
./train.sh
语音识别
- 准备待识别音频文件
- 运行
./eval.sh
启动推理
微调建议
如需在特定领域提升识别准确率:
- 准备领域相关数据
- 执行
./train.sh --finetune
进行微调 - 微调后模型可直接部署使用
本答案来源于文章《PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具》