環境準備
- ハードウェア要件NVIDIA GPUを搭載したコンピュータ(推奨グラフィックスメモリ:16GB以上)
- ソフトウェア基盤Python ≥ 3.8 + CUDA 11.8環境
- 依存するインストール::
pip install -r requirements.txt+ FlashAttention 2最適化パッケージ
ワークフロー
- 歌詞の準備プレーンテキストの歌詞をUTF-8でエンコードした.txtファイルとして保存します。
- 基本ジェネレーション・コマンド::
python generate_song.py --lyrics lyrics.txt --output song.wav - 高度なパラメーター調整を通じて入手可能
--styleで音楽スタイル(ポップス/メタルなど)を指定する。--vocalヴォーカル・タイプを選択
実践的アドバイス
中国のユーザーには、歌詞ファイルをおんせいひょうきメロディーの自然さを向上させるために、まず30秒の短いクリップで生成のテストを行うことができます(その際、[1]または[2]を追加してください)。--duration 30パラメーター)を使って、フルバージョンを生成する。
この答えは記事から得たものである。YuE:歌詞を完全な曲のベースモデルに変換し、幅広い音楽スタイルをサポートします。について































