A precisão insuficiente na detecção de alvos pequenos é um desafio comum no campo da detecção de alvos, e o YOLOv12 visa a esse problema introduzindo um mecanismo de atenção inovador e otimização estrutural. Abaixo estão as soluções específicas:
1. seleção de tamanhos de modelos apropriadosO uso de modelos de médio a grande porte (por exemplo, YOLOv12-M/L), que são equipados com recursos aprimorados de extração de recursos, é priorizado. Para cenários com recursos computacionais limitados, o desempenho pode ser equilibrado por técnicas de quantificação ou destilação.
2. uso de mecanismos de atenção regionalO módulo Area Attention do YOLOv12 se concentra automaticamente nas principais áreas e etapas de implementação:
- A função é ativada automaticamente durante o treinamento, sem necessidade de configuração adicional
- Aumente a resolução de entrada ajustando o parâmetro imgsz (recomendado ≥ 640)
- Observar alterações nos valores de PA de alvos pequenos durante a fase de validação
3. estratégia de aprimoramento de dados::
- Adicionar proporções de amostras de alvos pequenos ao data.yaml
- Usando o aprimoramento de dados de mosaico (ativado por padrão)
- Adicionar aprimoramento do RandomZoom
4. ajuste da função de perdaModifique os pesos de perda em runs/detect/train/args.json para aumentar os coeficientes de peso de alvo pequeno.
Após a implementação, você pode trabalhar com a ferramenta de supervisão para visualizar os resultados da inspeção e comparar as métricas de precisão antes e depois do ajuste.
Essa resposta foi extraída do artigoYOLOv12: uma ferramenta de código aberto para detecção de alvos em imagens e vídeos em tempo realO