MatAnyoneの標準的なワークフローには、以下の主要ステップが含まれます:
- 材料準備処理するビデオ(例:input_video.mp4)を
data/フォルダー、フォーマットサポートMP4/AVI - 最初のフレームマスクの作成Photoshopなどのツールを使って、白をターゲット領域としてPNG形式で1フレーム目を分割し、次のように保存する。
mask_frame1.png - キーイングコマンドの実行::
python inference.py --video data/input_video.mp4 --mask data/masks/mask_frame1.png --output output/ - 結果表示出力フォルダには、ビデオシーケンスまたは透明な背景を持つコンポジットビデオが含まれます。
高度な機能操作:
- 解像度調整追加
--resolution 1080エッジの品質を高めるパラメータ - メモリ融合の最適化修正
config.yaml正鵠を得るmemory_fusion_rate急激な光の変化に対応するパラメーター - バッチ対応シェルスクリプトを書くことで、自動的なマルチビデオ処理を実現できる。
注:最初のフレームマスクの精度は最終的な効果に直接影響するので、ターゲットエッジ領域の描画精度に特に注意することをお勧めします。
この答えは記事から得たものである。MatAnyone: ターゲットポートレート指定ビデオ抽出、ターゲットポートレートビデオ生成オープンソースツールについて




























