マスクエッジの最適化 テクニカル・ソリューション
SegAnyMoは、出力マスクのエッジのギザギザに対するマルチレベルの処理ソリューションを提供します:
- SAM2の後処理::
- sam2ディレクトリのpredictor.pyのpred_iou_threshを修正する(0.88-0.92推奨)
- バウンディングボックスの反復最適化で -use_box_refine パラメータを有効にする。
- マルチモーダルフュージョン::
- DINOv2のセマンティック機能と組み合わせる(dinosカタログのフィーチャーマップ)
- depth_anything_v2からの深度情報の融合
- core/utils/fusion.pyによるマルチモーダル投票
- 形態論的処理::
- 出力段にmorphologyEx操作を追加(core/utils/vis_utils.pyの修正が必要)
- 膨張と腐食のために推奨される3×3の楕円コア
特に複雑なエッジ(髪の毛、透明なオブジェクトなど)については、1)微調整のための特別なデータを収集する、2)トレーニング中にedge_lossのウェイトを増やす、3)少数のキーフレームに手動でアノテーションを付けてから、-custom_trainパラメータでモデル適応を行う、ことを推奨する。
この答えは記事から得たものである。SegAnyMo: ビデオから任意の移動物体を自動的にセグメント化するオープンソースツールについて































