Personalização do processo de treinamento
O YOLOE oferece suporte à adaptação de novos objetos de três maneiras:
Programa I: Ajuste fino dos prompts de texto (curso intensivo de 5 minutos)
- Prepare de 10 a 20 imagens rotuladas (formato COCO)
- modificações
class_names.txtAdicionar nova categoria (por exemplo, "defective_part") - Em execução:
python train_text_prompt.py --data custom.yaml --weights yoloe-s.pt
Programa II: Treinamento de dicas visuais (para categorias não especificadas)
- Passos:
- fazer uso de
generate_sam_masks.pyGerar máscaras de segmentação de gráficos de referência - realizar
train_vp.pyTreinamento do codificador visual - Carga na previsão
vp_model.ptpara referência
- fazer uso de
Opção 3: Treinamento completo do modelo (maior precisão)
É necessário preparar mais de 1.000 desenhos rotulados:
- Converta o conjunto de dados:
python tools/convert2yolo.py --data_path ./custom - Gerar um cache:
python generate_grounding_cache.py --img-path ./train --json-path annotations.json - Inicie o treinamento (recomenda-se a placa de vídeo A100):
python train_seg.py --batch 64 --epochs 100
Essa resposta foi extraída do artigoYOLOE: uma ferramenta de código aberto para detecção de vídeo em tempo real e segmentação de objetosO































