YOLOv12是由GitHub用户sunsmarterjie主导开发的开源实时目标检测工具,属于YOLO(You Only Look Once)系列的最新演进版本。该项目由布法罗大学和中科院研究人员共同参与,专注于通过深度学习技术实现高精度、低延迟的目标检测。
核心改进包括:
- アテンション・メカニズムの最適化:引入”区域注意力”(Area Attention)和R-ELAN模块,自动优化特征提取过程,显著提升小目标检测能力
- 多模型架构:提供Nano/Small/Medium/Large/Extra-Large五种预训练模型,适配从边缘设备到服务器集群的不同硬件环境
- 精度-速度平衡:在T4 GPU上,基础版模型(YOLOv12-N)达到40.6% mAP的同时保持1.64ms超低延迟
- 展開のしやすさ:支持导出ONNX和TensorRT格式,便于工业级应用部署
项目采用GNU AGPL-3.0开源协议,完整保留YOLO系列单阶段检测架构的优势,同时通过模块化设计降低算法复杂度。
この答えは記事から得たものである。YOLOv12:リアルタイム画像・ビデオターゲット検出のためのオープンソースツールについて