海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする
現在の場所図頭 " AIアンサー

LatentSyncバージョン1.5の主な技術的改良点は何ですか?

2025-08-27 2.4 K

バージョン1.5の技術的アップグレード

2025年3月にリリースされたバージョン1.5では、3つの核となる改良が加えられている:

1.時間の一貫性の向上

  • 採用TREPAテクノロジー(タイミング相対位置注意)フレーム間ジッターの低減
  • 前後のフレーム間の相関を強化する新しい時間畳み込み層
  • デモビデオ42%における画面ジャンプの低減

2.中国処理の最適化

  • ウィスパーモデルの拡張中国語の音素認識能力
  • 200時間以上の中国語ビデオサンプルをトレーニングデータに追加
  • 中国リップの形状精度が78%から91%に向上

3.トレーニング効率の向上

  • U-Netアーキテクチャを再構成し、ビデオメモリフットプリントを25%削減(トレーニング用に20GBを準備)
  • stage2_efficient.yamlの軽量化設定を追加
  • アジュバント勾配チェックポイントより安定した長時間のビデオトレーニングを可能にする技術

これらの改善により、LatentSyncは品質を維持しながら、プロフェッショナルでない開発者にも適しています。

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

トップに戻る

ja日本語