キュー・ワードを最適化するための実践ガイド
コンテンツの偏り問題には、3段階の最適化戦略が推奨される:
- 構造化記述法例えば、「ゴールデン・レトリーバー(被写体)が浜辺を走っている(アクション)、夕日(環境)、8Kフィルムの質感(スタイル)」というように、「被写体-アクション-環境-スタイル」という構造に従ってプロンプトを書く。
- GPT-4oエンハンスト・モードRefine-prompt True パラメータを有効にすると、簡単なプロンプトを、カメラアングルや照明などの専門用語を含む長いプロンプトに自動的に展開します。
- ネガティブ・キューイング・テクニック: 設定ファイルにunprompted.txtを追加し、除外する要素を定義する(例:「ぼやけた、歪んだ顔、余分な手足」)。
- 段階的検証フルバージョンを生成する前に、2秒間のプレビュービデオ(-num-frames 17)で方向性を確認する。
- 参考図表 ロックこの値が高いほど、参照画像の特徴がより多く保存される。
この答えは記事から得たものである。Open Sora:顔の一貫性を最適化するオープンソースのビデオ生成ツールについて