MatAnyoneの革新的な最初のフレームマスク予測メカニズムは、ビデオキーイングのワークフローを大幅に簡素化します。従来の方法では通常、複数のフレームを手作業でラベリングする必要がありましたが、MatAnyoneは最初のフレームのセグメンテーションマスク(PNGフォーマットで、白がターゲット領域を示し、黒が背景を示す)だけを必要とし、そこから後続のすべてのフレームのアルファマットを予測することができます。
ユーザーは、Photoshopなどのツールを使用して最初のフレームマスクを作成するか、オープンソースのセグメンテーションツールの助けを借りてそれを生成することができます。システムは最初のフレームマスクの品質に敏感で、特にエッジ領域の精度はその後の予測結果に大きく影響するため、ユーザーはこの部分に十分な注意を払うことを推奨する。
この答えは記事から得たものである。MatAnyone: ターゲットポートレート指定ビデオ抽出、ターゲットポートレートビデオ生成オープンソースツールについて































