YOLOE(You Only Look Once Eye)是由清华大学软件学院多媒体智能组(THU-MIG)开发的开源实时目标检测与分割工具。它基于PyTorch框架,是YOLO系列的扩展版本,具备以下核心特点:
- 多模式检测:支持文本提示、视觉提示和无提示三种检测模式
- 高效性能:在LVIS数据集上速度比YOLO-Worldv2快1.4倍,训练成本低3倍
- 广泛兼容:可无缝转换为YOLOv8/YOLO11格式,无额外推理开销
- 高扩展性:自动识别1200+种物体,支持自定义模型训练
- 跨平台部署:提供TensorRT(GPU)和CoreML(移动端)等多种部署方案
本答案来源于文章《YOLOE:实时视频检测和分割物体的开源工具》