环境准备指南
在安装HumanOmni前,需要确保系统满足以下技术要求:
Requisitos de hardware
- placa de vídeo (computador):推荐NVIDIA GPU(显存≥12GB)
- CPU:最低4核处理器(仅CPU模式性能较低)
- memória de acesso aleatório (RAM):建议32GB以上
dependência de software
- 基础环境:Python 3.10+/PyTorch 2.2+
- 加速组件:CUDA 12.1+(GPU用户必需)
- confiança especial:flash-attn高性能注意力库
四步安装流程
- Armazém de Clonagem:
git clone https://github.com/HumanMLLM/HumanOmni.git
- Crie um ambiente conda:
conda create -n humanOmni python=3.10
- Instale a dependência:
pip install -r requirements.txt
- 下载模型:从Hugging Face获取7B参数模型(约10GB)
Verificar a instalação
Execute o comando de teste:python inference.py --modal video --model_path ./HumanOmni_7B --video_path test.mp4
,成功输出视频描述即表示安装完成。
Essa resposta foi extraída do artigoHumanOmni: um macromodelo multimodal para análise de emoções e ações em vídeos humanosO