革命的なテキスト主導の世界構築機能
Genie3では、ユーザーが詳細な説明(例えば「朝靄に包まれたヴェネツィアの運河、その両側にはルネッサンス建築」)を入力すると、モデルが90秒以内に完全な3Dインタラクティブ・シーンを生成する、新しい「記述-創作」モードが確立されました。この機能の背景にある主な技術的ブレークスルーは、1)テキストのセマンティクスを空間構造に正確にマッピングするクロスモーダル理解システム、2)照明や水の流れなどの物理的特性を自動的に補完する動的要素予測エンジン、3)折り紙やピクセルアートなどの特定のアートスタイルに適応するスタイル変換ネットワークである。ケーステストでは、説明文から再生可能なシーンへの変換成功率は78%に達し、既存のテキスト生成ビデオツール(Veoなど)の完成基準35%をはるかに上回っている。
この答えは記事から得たものである。Genie 3: リアルタイムで相互作用できる仮想世界の生成について































