相比上一代Wan2.1,Wan2.2在训练数据方面取得了重大进展。具体而言,它的训练数据集增加了65.6%的图像数据和83.2%的视频数据,这些新增的数据显著提升了模型在多个维度的表现:运动生成更加自然流畅,语义理解能力更加细致准确,美学效果也达到了电影级水准。如此大规模的数据积累,使Wan2.2能够处理更复杂的场景描述,生成更专业的视觉效果,这也是它能在Wan-Bench 2.0基准测试中超越部分商业模型的重要原因之一。
この答えは記事から得たものである。Wan2.2:テキストと画像を動画に効率的に変換するオープンソースの動画生成モデルについて