开创性的动态交互体验
Genie 3的交互系统实现了三大技术创新:首先是每秒24帧的自回归渲染管线,通过空间注意力机制保持画面连贯性;其次是行为响应预测模块,能理解’左转30度’等指令并计算后续300帧画面;最后是场景记忆矩阵,采用类大脑海马体的神经架构,确保用户离开原区域5分钟后重返时,场景物体仍保持原状态(测试准确率达92%)。相比Runway等视频生成工具,其交互延迟控制在80ms以内,达到游戏级体验标准,这是通过专用张量处理芯片TPUv5实现的硬件突破。
本答案来源于文章《Genie 3:生成可实时交互的虚拟世界》