Installationsschritte
- Klonen des Projektlagers:
git clone https://github.com/yangb05/PengChengStarling cd PengChengStarling
- Installieren Sie die Abhängigkeit:
pip install -r requirements.txt export PYTHONPATH=/tmp/PengChengStarling:$PYTHONPATH
Verwendungsprozess
Vorbereitung der Daten
运行prepare.py脚本适配数据格式,生成data.list文件和相关特征。
Modellschulung
- 配置config_train目录中的参数
- 执行训练命令
./train.sh
Spracherkennung
- 准备待识别音频文件
- in Bewegung sein
./eval.sh
启动推理
微调建议
如需在特定领域提升识别准确率:
- 准备领域相关数据
- vollziehen
./train.sh --finetune
Feinabstimmung - 微调后模型可直接部署使用
Diese Antwort stammt aus dem ArtikelPengChengStarling: Kleineres und schnelleres mehrsprachiges Speech-to-Text-Tool als Whisper-Large v3Die