Etapas de instalação
- Clonagem do Project Warehouse:
git clone https://github.com/yangb05/PengChengStarling cd PengChengStarling
- Instale a dependência:
pip install -r requirements.txt export PYTHONPATH=/tmp/PengChengStarling:$PYTHONPATH
Processo de uso
Preparação de dados
运行prepare.py脚本适配数据格式,生成data.list文件和相关特征。
treinamento de modelos
- 配置config_train目录中的参数
- 执行训练命令
./train.sh
reconhecimento de fala
- 准备待识别音频文件
- estar em movimento
./eval.sh
启动推理
微调建议
如需在特定领域提升识别准确率:
- 准备领域相关数据
- realizar
./train.sh --finetune
ajuste fino - 微调后模型可直接部署使用
Essa resposta foi extraída do artigoPengChengStarling: ferramenta de conversão de fala em texto multilíngue menor e mais rápida que o Whisper-Large v3O