インストール手順
- クローン・プロジェクト・ウェアハウス
git clone https://github.com/yangb05/PengChengStarling cd PengChengStarling - 依存関係をインストールします:
pip install -r requirements.txt export PYTHONPATH=/tmp/PengChengStarling:$PYTHONPATH
使用プロセス
データ準備
prepare.pyスクリプトを実行し、データフォーマットを適合させ、data.listファイルと関連するフィーチャーを生成します。
モデルトレーニング
- config_train ディレクトリでパラメータを設定する。
- トレーニング・コマンドの実行
./train.sh
音声認識
- 認識する音声ファイルを準備する
- うごきだす
./eval.sh推論
微調整のすすめ
特定の分野で認識精度を向上させる必要がある場合:
- 準備分野の関連データ
- はこびだす
./train.sh --finetune微調整 - 微調整されたモデルが配備の準備完了
この答えは記事から得たものである。PengChengStarling: Whisper-Large v3より小型で高速な多言語音声テキスト変換ツールについて































