トレーニング・プロセスのカスタマイズ
YOLOEは、3つの方法で新しいオブジェクトの適応をサポートしている:
プログラムI:テキストプロンプトの微調整(5分間のクラッシュコース)
- ラベル付き画像を10~20枚用意する(COCOフォーマット)
- 修正
class_names.txt新しいカテゴリーを追加する(例:"defect_part") - 走っている:
python train_text_prompt.py --data custom.yaml --weights yoloe-s.pt
プログラムII:視覚的手がかりトレーニング(不特定カテゴリー用)
- ステップ
- 利用する
generate_sam_masks.pyリファレンス・グラフ・セグメンテーション・マスクの生成 - はこびだす
train_vp.py視覚エンコーダーのトレーニング - 予測への負荷
vp_model.pt参考
- 利用する
オプション3:フルモデルトレーニング(最高精度)
1000枚以上のラベル付き図面を用意する必要がある:
- データセットを変換する:
python tools/convert2yolo.py --data_path ./custom - キャッシュを生成する:
python generate_grounding_cache.py --img-path ./train --json-path annotations.json - トレーニングを開始する(A100グラフィックカードを推奨):
python train_seg.py --batch 64 --epochs 100
この答えは記事から得たものである。YOLOE: リアルタイムのビデオ検出と物体分割のためのオープンソースツールについて































