ChatAnyoneは、HumanAIGCチームによって開発されたAIデジタルヒューマン生成ツールで、その中核機能は、1枚のポートレート写真と音声入力から、上半身の動き(頭の回転、ジェスチャーの変化、表情を含む)を持つデジタルヒューマンビデオを自動的に生成することです。このプロジェクトは、階層的モーション拡散モデリング技術に基づいており、主な機能は以下の通りです:
- マルチモーダルなインプットとアウトプット音声付き静止画を動画に変換
- モーション・ジェネレーション機能頭の動き(うなずきなど)、6種類の基本ジェスチャー(ハート、手を振るなど)、リップシンクロに対応。
- プロ仕様の出力最大解像度512 x 768、30FPSのビデオ生成、NVIDIA 4090 GPUでの効率的なレンダリングに対応
類似のツールと比較して、上半身の動的なディテールの洗練に重点を置いているのが特徴で、仮想画像表示やアニメーション制作などの技術的なシーンに適している。現在、プロジェクトは技術実証に重点を置いており、GitHubを通じて実装の詳細を共有しているが、完全なオープンソースではない。
この答えは記事から得たものである。ChatAnyone:写真から半身のデジタル人物ビデオを生成するツールについて































