海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする
現在の場所図頭 " AIアンサー

ChatAnyoneは階層的運動拡散モデルに基づくデジタル人物生成ツールである

2025-08-27 1.6 K

ChatAnyoneの基本的な技術アーキテクチャ

ChatAnyoneは、HumanAIGCチームによるデジタル人物生成分野における重要な革新である、最先端の階層的モーション拡散モデルをコア技術フレームワークとして使用しています。このモデルは、拡散アルゴリズムの多段階処理能力を通じて、静的な画像と音声入力を首尾一貫したモーションシーケンスに変換します。1)頭部運動レイヤーは自然な頭部の回転を生成する役割を担い、2)ジェスチャー運動レイヤーは人間の上肢のボディランゲージをシミュレートし、3)表情レイヤーは顔の微表情が発話内容と同期することを保証する。このレイヤー設計により、システムは異なる身体部位のモーション・パラメータを並行して処理することができ、従来の単一レイヤーLSTM方式よりもバイオメカニクス的に正しいモーション・シーケンスを生成することができる。

技術デモンストレーションでは、NVIDIA 4090 GPU環境において、解像度512×768、30FPSのビデオストリームを安定的に出力することができ、このアーキテクチャの工学的な実現可能性を証明した。このプロジェクトのGitHubページによると、動作拡散モデルは、様々な文化的背景からのボディランゲージの特徴を含む1,000時間以上のアノテーションされたモーションデータを使用してトレーニングされた。現在のコードは完全にオープンソース化されているわけではないが、技術的なルートはデジタルヒューマン分野に学習可能なソリューションを提供した。

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

トップに戻る