フラッシュ・アテンション
Windowsユーザー特有の制限に対応するため、以下の代替手段を用意しています:
- WSLソリューションズWindows Subsystem for Linuxのデプロイ環境は、Linuxのインストールプロセスと完全に互換性があります。WSLでCUDAドライバを設定し、標準のインストールコマンドを実行する必要があります。
- メモリの最適化requirements.txtに追加
memory_efficient_attentionフラッシュ・アテンションより少し劣るが、複雑なコンパイルは必要ない。 - ドッカー・プログラムビルド済みのDockerイメージを使う
deepbeepmeep/hvpg:win-supportすべての最適化コンポーネントが統合されている - パラメーター調整補正config.jsonの "attention_type "を "memory_efficient "に変更し、"resolution_scale":0.7を下げる。scale":0.7とする。
それでも問題が解決しない場合は、フラッシュ・アテンションへの依存度が低いクオンタイズド・モデル+12GB構成の組み合わせに変更することをお勧めします。
この答えは記事から得たものである。HunyuanVideoGP:ローエンドGPU動作をサポートするハイブリッドビデオ生成モデルについて




























