Unzureichende Genauigkeit bei der Erkennung kleiner Ziele ist eine häufige Herausforderung im Bereich der Zielerfassung. YOLOv12 geht dieses Problem durch die Einführung eines innovativen Aufmerksamkeitsmechanismus und struktureller Optimierung an. Im Folgenden werden die spezifischen Lösungen vorgestellt:
1. die Auswahl der geeigneten ModellgrößenVorrangig werden mittelgroße bis große Modelle (z. B. YOLOv12-M/L) verwendet, die mit erweiterten Funktionen zur Merkmalsextraktion ausgestattet sind. Bei Szenarien mit begrenzten Rechenressourcen kann die Leistung durch Quantifizierungs- oder Destillationstechniken ausgeglichen werden.
2. die Nutzung der regionalen AufmerksamkeitsmechanismenDas Modul Area Attention von YOLOv12 konzentriert sich automatisch auf Schlüsselbereiche und Umsetzungsschritte:
- Die Funktion wird während des Trainings automatisch aktiviert, eine zusätzliche Konfiguration ist nicht erforderlich.
- Erhöhen Sie die Eingangsauflösung durch Anpassung des Parameters imgsz (empfohlen ≥ 640)
- Beobachten Sie die Veränderungen der AP-Werte von kleinen Zielen während der Validierungsphase
3. die Strategie zur Datenanreicherung::
- Hinzufügen von kleinen Zielprobenanteilen zu data.yaml
- Verwendung der Mosaikdatenerweiterung (standardmäßig aktiviert)
- RandomZoom-Erweiterung hinzufügen
4. die Abstimmung der VerlustfunktionModifizieren Sie die Verlustgewichte in runs/detect/train/args.json, um die kleinen Zielgewichtskoeffizienten zu erhöhen.
Nach der Implementierung können Sie mit dem Überwachungswerkzeug arbeiten, um die Inspektionsergebnisse zu visualisieren und die Genauigkeitskennzahlen vor und nach der Anpassung zu vergleichen.
Diese Antwort stammt aus dem ArtikelYOLOv12: ein Open-Source-Tool für die Echtzeit-Erkennung von Bild- und VideozielenDie































