Gaze-LLE を使用するためには、以下のインストールと設定の手順が必要です:
インストールプロセス:
- クローン・プロジェクト・ウェアハウス
git clone https://github.com/fkryan/gazelle.git - プロジェクト・ディレクトリに移動し、仮想環境を作成する:
conda env create -f environment.yml - 環境をアクティブにし、依存関係をインストールする:
conda activate gazelle && pip install -e . - オプションでxformersアクセラレーションをインストール:
pip3 install -U xformers
モデル使用:
Gaze-LLEは、PyTorch Hub経由で素早く読み込むことができる事前学習済みのモデルを幅広く取り揃えています:
- ベースモデル:
torch.hub.load('fkryan/gazelle', 'gazelle_dinov2_vitb14') - 大規模モデリング:
torch.hub.load('fkryan/gazelle', 'gazelle_dinov2_vitl14')
予測出力:
このモデルは、各位置で注視される確率を示す[0,1]の範囲の値を持つ空間ヒートマップを生成する。ユーザーは、Colabデモノートを通じて、完全な多人数注視予測の実装プロセスについて学ぶことができます。
この答えは記事から得たものである。Gaze-LLE:映像中の人物注視のターゲット予測ツールについて































