环境准备指南
在安装HumanOmni前,需要确保系统满足以下技术要求:
ハードウェア要件
- ディスプレイカード:推荐NVIDIA GPU(显存≥12GB)
- CPU:最低4核处理器(仅CPU模式性能较低)
- ランダムアクセスメモリ:建议32GB以上
ソフトウェア依存
- 基础环境:Python 3.10+/PyTorch 2.2+
- 加速组件:CUDA 12.1+(GPU用户必需)
- 特別な信頼:flash-attn高性能注意力库
四步安装流程
- クローン倉庫
git clone https://github.com/HumanMLLM/HumanOmni.git
- conda環境を作成する:
conda create -n humanOmni python=3.10
- 依存関係をインストールします:
pip install -r requirements.txt
- 下载模型:从Hugging Face获取7B参数模型(约10GB)
インストールの確認
テストコマンドを実行する:python inference.py --modal video --model_path ./HumanOmni_7B --video_path test.mp4
,成功输出视频描述即表示安装完成。
この答えは記事から得たものである。HumanOmni:人間のビデオ感情や行動を分析するためのマルチモーダル・マクロモデルについて