Maskenrand-Optimierung Technische Lösung
SegAnyMo bietet eine mehrstufige Verarbeitungslösung für die Kantenschärfe von Ausgabemasken:
- SAM2-Nachbearbeitung::
- Ändern Sie pred_iou_thresh in predictor.py im Verzeichnis sam2 (0.88-0.92 empfohlen)
- Aktivieren des Parameters -use_box_refine für die iterative Optimierung von Begrenzungsrahmen
- multimodale Verschmelzung::
- Kombiniert mit den semantischen Merkmalen von DINOv2 (Merkmalskarte im Dinos-Katalog)
- Zusammenführung von Tiefeninformationen aus depth_anything_v2
- Multimodale Abstimmung über core/utils/fusion.py
- morphologische Bearbeitung::
- Hinzufügen der MorphologyEx-Operation zur Ausgabestufe (erfordert Änderung von core/utils/vis_utils.py)
- Empfohlene 3×3 elliptische Kerne für Expansion und anschließende Korrosion
Für besonders komplexe Kanten (z. B. Haare, transparente Objekte) wird empfohlen, 1) spezielle Daten für die Feinabstimmung zu sammeln; 2) die Gewichtung von edge_loss während des Trainings zu erhöhen; und 3) eine kleine Anzahl von Keyframes manuell zu annotieren und dann eine Modellanpassung über den Parameter -custom_train durchzuführen.
Diese Antwort stammt aus dem ArtikelSegAnyMo: ein Open-Source-Tool zur automatischen Segmentierung beliebiger bewegter Objekte aus VideosDie































