Wan2.2-S2V-14B:音声駆動型キャラクター口パク同期のための映像生成モデル
Wan2.2-S2V-14Bは、Wan-AIチームによって開発された大規模なAIモデルで、音声、テキスト、画像に基づく高品質なビデオの生成に特化しています。 革新的な混合エキスパート(MoE)アーキテクチャを採用し、合計27Bのモデルパラメータを持ちますが、実行時にアクティブになるのは14Bのみで、パフォーマンスと...
Wan2.2:テキストと画像を動画に効率的に変換するオープンソースの動画生成モデル
Wan2.2は、Alibaba Tongyi Labsによって開発されたオープンソースの動画生成モデルで、テキストや画像から高品質の動画を生成することに重点を置いています。Mixed Expert(MoE)アーキテクチャを採用し、ノイズの多い段階と少ない段階のノイズ除去処理を分離することで、計算効率を維持しながら生成品質を大幅に向上させている。
インデックス-アニソラ:Bilibiliオープンソースアニメビデオ生成ツール
Index-AniSoraは、ビリビリが開発しオープンソース化したアニメ動画生成モデルで、GitHubでホストされている。CogVideoX-5BとWan2.1-14Bをベースモデルとしており、アニメエピソード、国内オリジナルアニメ、漫画原作、VTubeなど、多様なアニメスタイルの動画生成をサポートしています。
シーダンス 1.0
Seedance 1.0は、ByteDanceのSeedチームによって開発されたAIビデオ生成ツールで、テキストや画像を高品質のビデオコンテンツに変換することに重点を置いています。ユーザーはテキストの説明文を入力するか、画像をアップロードするだけで、Seedanceは最大解像度1080pの動画を生成することができ、クリエイティブなコンテンツ制作に適しています。
ムービージェン 1.1
MoviiGen 1.1は、ZuluVisionによって開発されたオープンソースのAIツールで、テキストから高品質のビデオを生成することに重点を置いています。720Pと1080Pの解像度をサポートしており、特に映画のような視覚効果を必要とするプロのビデオ制作に適しています。簡単なテキスト説明から、自然でダイナミックな動画を生成することができます。
LTX Video (LTXV): 高品質ビデオを生成するリアルタイムビデオ生成のオープンソースモデル
LTX-Videoは、Lightricksが開発した初のDiT(Diffusion Transformer)ベースのリアルタイムビデオ生成モデルです。LTX-Videoは、768×512の解像度で24フレーム/秒の高品質ビデオを生成することができます。
トップに戻る