小目標検出の精度不足は目標検出分野における一般的な課題であり、YOLOv12は革新的なアテンション機構と構造最適化を導入することでこの問題に対処している。具体的な解決策は以下の通り:
1. 適切なモデル規模を選択する:中大型モデル(例:YOLOv12-M/L)を優先的に使用し、これらのモデルはより強力な特徴抽出能力を備えている。計算リソースが制限されるシナリオでは、量子化や蒸留技術によって性能のバランスを取ることができる。
2. 領域別注意機構の活用:YOLOv12のArea Attentionモジュールは自動的に重要な領域に焦点を合わせ、実施手順:
- トレーニング時に自動的にこの機能を有効化し、追加設定は不要です
- imgszパラメータを調整(推奨値≥640)して入力解像度を拡大する
- 検証段階における小目標AP値の変化の観察
3. データ拡張戦略::
- data.yamlにサブターゲットのサンプル比率を追加する
- モザイクデータ拡張を使用(デフォルトで有効)
- ランダムズーム強化を追加
4. 損失関数の最適化runs/detect/train/args.json内の損失重みを修正し、サブターゲットの重み係数を増加させる。
実施後はSupervisionツールと連携し、検出効果を可視化して、調整前後の精度指標を比較できます。
この答えは記事から得たものである。YOLOv12:リアルタイム画像・ビデオターゲット検出のためのオープンソースツールについて































