自定义训练流程
YOLOE支持通过三种方式适配新物体:
方案一:文本提示微调(5分钟速成)
- 准备10-20张带标注图片(COCO格式)
- modificações
class_names.txt
添加新类别(如”defective_part”) - Em execução:
python train_text_prompt.py --data custom.yaml --weights yoloe-s.pt
方案二:视觉提示训练(适合无明确类别)
- Passos:
- fazer uso de
generate_sam_masks.py
生成参考图分割掩码 - realizar
train_vp.py
训练视觉编码器 - 预测时加载
vp_model.pt
作为参考
- fazer uso de
方案三:全模型训练(最高精度)
需准备>1000张标注图:
- 转换数据集:
python tools/convert2yolo.py --data_path ./custom
- 生成缓存:
python generate_grounding_cache.py --img-path ./train --json-path annotations.json
- 启动训练(推荐A100显卡):
python train_seg.py --batch 64 --epochs 100
Essa resposta foi extraída do artigoYOLOE: uma ferramenta de código aberto para detecção de vídeo em tempo real e segmentação de objetosO