YOLOE (You Only Look Once Eye) は、清華大学ソフトウェア学部マルチメディア・インテリジェンス・グループ (THU-MIG) によって開発されたオープンソースのリアルタイムターゲット検出およびセグメンテーションツールです。PyTorchフレームワークをベースとしており、YOLOシリーズの拡張版として以下のコア機能を備えている:
- マルチモード検出テキスト・キュー、ビジュアル・キュー、キューなしの3つの検出モードをサポート。
- 高性能LVISデータセットにおいてYOLO-Worldv2より1.4倍速く、学習コストは3倍低い。
- 広い互換性推論のオーバーヘッドを追加することなく、YOLOv8/YOLO11フォーマットへシームレスに変換。
- 高い拡張性1200以上のオブジェクトの自動認識、カスタムモデルのトレーニングをサポート
- クロスプラットフォーム展開TensorRT (GPU)やCoreML (モバイル)など、複数のデプロイオプションを提供します。
この答えは記事から得たものである。YOLOE: リアルタイムのビデオ検出と物体分割のためのオープンソースツールについて































