Installationsschritte
- Klonen des Projektlagers:
git clone https://github.com/yangb05/PengChengStarling cd PengChengStarling - Installieren Sie die Abhängigkeit:
pip install -r requirements.txt export PYTHONPATH=/tmp/PengChengStarling:$PYTHONPATH
Verwendungsprozess
Vorbereitung der Daten
Führen Sie das Skript prepare.py aus, um das Datenformat anzupassen und die Datei data.list sowie die zugehörigen Merkmale zu erzeugen.
Modellschulung
- Konfigurieren Sie die Parameter im Verzeichnis config_train
- Ausführung von Trainingsbefehlen
./train.sh
Spracherkennung
- Bereiten Sie die zu erkennende Audiodatei vor
- in Bewegung sein
./eval.shInferenz
Empfehlungen für die Feinabstimmung
Wenn die Erkennungsgenauigkeit in einem bestimmten Bereich verbessert werden soll:
- Einschlägige Daten im Bereich der Bereitschaft
- vollziehen
./train.sh --finetuneFeinabstimmung - Feinabgestimmtes Modell bereit für den Einsatz
Diese Antwort stammt aus dem ArtikelPengChengStarling: Kleineres und schnelleres mehrsprachiges Speech-to-Text-Tool als Whisper-Large v3Die































