7月25日EST、AI Video, Inc. ランウェイ が最新の調査結果を発表した。Runway Aleph
同社の技術は、同社の製品ポートフォリオに新たに加わったエキサイティングなものだ。一般的に「テキストからビデオへ」の生成機能に重点を置いていた前身や競合他社とは異なる。Aleph
インコンテクスト動画モデル」と定義されるこのモデルは、何もないところから動画を作成するのではなく、既存の動画コンテンツをより深く理解し、編集的に変換することに重点を移している。
この動きは OpenAI Sora
とレーサー Kling
このようなモデルが映像生成のクオリティを新たな高みへと押し上げた後、ヘッドプレーヤーたちは映像生成の次の中心的な戦場である「操作性」と「ポスト編集」を探求し始めた。
コンテキスト・アウェアネス」とは何か?
以前は、AIビデオツールの中心的なタスクは、テキストプロンプトに基づいて全く新しいビデオを作成することでした。その代わり Runway Aleph
中心的な違いは、入力されたビデオの内部要素、シーン、文脈を「読み取り」、それに基づいて正確で複雑な修正を行う能力にある。
単なる「撮影」というより、知的なビデオの「ポストプロダクション」に近い。ランウェイが公開した公式デモによるとAleph
その能力は以下の分野に反映されている:
- 新しいカメラポジションとパースペクティブの生成
ユーザーは既存のビデオ映像を入力し、「ミディアムショットを生成する」「ローアングルから撮影する」といった簡単なテキストコマンドを入力するだけで、元の映像にはない新しいカメラアングルを作成することができる。映画やテレビの制作にとって、これは豊富なカメラ言語と追加ショットを低コストで得られることを意味する。
コマンド:"中距離フルショット"
- 物語のシームレスな続き
Aleph
映像の最後のフレームの内容とダイナミクスを理解し、論理的に首尾一貫した次の映像セグメントを生成する能力によって、ストーリーのシームレスな継続が可能になる。コマンド:"次のショットを生成"
- 任意のスタイルでの移行
任意の画像やビデオの芸術的なスタイルをターゲットビデオに適用し、全体的に美的に変換します。この機能自体は新しいものではないが
Aleph
その強さは、内容とダイナミクスの保持力の高さにある。コマンド:"ビデオのスタイルを変換する"
- 環境要素の変更
これは
Aleph
最も破壊的な機能のひとつ。被写体のダイナミクスや構造を基本的に変えずに、天候(雨や雪を追加)や時間帯(昼から夜へ)、ロケーションを変えるなど、映像内の環境に劇的な変化を加えることができる。この機能は、ビジュアル・エフェクト(VFX)のハードルを大幅に下げるだろう。コマンド:"雨の効果を上げる"。
世代」から「編集」への戦略転換
Runway
AIビデオ生成ツールを商品化した最初の企業の1社として、次のように述べた。 Gen-1
動画を動画に変換する Gen-2
テキストからビデオへの変換は、市場のペースを作ってきた。しかし Sora
歌で応える Kling
純粋な "ジェネレイティブ "回路は、生成時間、解像度、物理的な一貫性の点で驚異的な能力を示したため、非常に混雑した。
Aleph
としてリリースされた。 Runway
世代クオリティ」において巨人と軍拡競争を繰り広げるのではなく、クリエイティブツールの分野での蓄積を活かして、「ポスト世代」の編集・合成市場に切り込む別の方法を見つけるべきだ。この市場は、実用性、操作性、ワークフローの統合にもっと注意を払うべきであり、それは偶然にもプロのクリエイターたちの核心的なペインポイントなのである。
Runway Aleph
もはやAIを使い捨ての "ブラックボックス "クリエーターにするのではなく、人間のクリエーターと繰り返し対話し、反復的に修正できる知的アシスタントとして位置づけることだ。この「人間と機械のコラボレーション」モデルは、完全な自動生成を追求するよりも、現在の創造的な仕事の現実に近いかもしれない。
公式発表によるとRunway Aleph
の早期アクセスは、まず法人顧客とクリエイティブ・パートナーに提供され、その後徐々に全ユーザーに拡大される。これは Runway
と協力することで、プロフェッショナル市場と商業市場を優先させるという一貫した戦略をとっている。 Lionsgate
などが、実際のワークフローで製品の価値を磨いている。