Overseas access: www.kdjingpai.com
Bookmark Us
Current Position:fig. beginning " AI Answers

What are the key technical improvements in LatentSync version 1.5?

2025-08-27 2.4 K

1.5 版本技术升级

2025 年 3 月发布的 1.5 版本带来三大核心改进:

1. 时间一致性增强

  • adoptionTREPA 技术(时序相对位置注意力)减少帧间抖动
  • 新增时序卷积层强化前后帧关联性
  • 演示视频中画面跳动降低 42%

2. 中文处理优化

  • 扩展 Whisper 模型的中文音素识别abilities
  • 训练数据加入 200+ 小时中文视频样本
  • 中文唇形准确率从 78% 提升至 91%

3. 训练效率提升

  • U-Net 结构重构,显存占用降低 25%(20GB 即可训练)
  • 新增 stage2_efficient.yaml 轻量配置
  • be in favor ofgradient checkpoint技术,长视频训练更稳定

这些改进使 LatentSync 在保证质量的同时更适合非专业开发者使用。

Recommended

Can't find AI tools? Try here!

Just type in the keyword Accessibility Bing SearchYou can quickly find all the AI tools on this site.

Top

en_USEnglish