低コンフィギュレーション・デバイスのための最適化されたソリューション:
- 強制ローメモリーモード使用
generate_lowmem.sh
スクリプトが標準のスクリプトを置き換え、GPUに必要なメモリを10GBに削減 - フラッシュ・アテンションを無効にする追加
--not_use_flash_attn
CUDA 11.8をサポートしていない古いグラフィックカード用のパラメータ - 入力内容の簡素化モデルの計算の複雑さを軽減するために、リファレンス音声とテキスト記述を同時に使用することは避けてください。
- Dockerイメージの使用公式ミラー
juhayna/song-generation-levo:hf0613
最適化パラメータは、以下の方法で事前に設定されている。--network=host
資源フットプリントの削減 - ステップ・バイ・ステップ生成最初は純粋な音楽トラックで、次にボーカルを別々に生成し、最後にオーディオツールで合成する。
この答えは記事から得たものである。SongGeneration: 高品質の音楽と歌詞を生成するオープンソースのAIモデルについて