环境准备指南
在安装HumanOmni前,需要确保系统满足以下技术要求:
Hardware-Voraussetzung
- Anzeigekarte (Computer):推荐NVIDIA GPU(显存≥12GB)
- CPU:最低4核处理器(仅CPU模式性能较低)
- Direktzugriffsspeicher (RAM):建议32GB以上
Software-Abhängigkeit
- Basisumgebung:Python 3.10+/PyTorch 2.2+
- 加速组件:CUDA 12.1+(GPU用户必需)
- besonderes Vertrauen:flash-attn高性能注意力库
四步安装流程
- Klon-Lagerhaus:
git clone https://github.com/HumanMLLM/HumanOmni.git
- Erstellen Sie eine conda-Umgebung:
conda create -n humanOmni python=3.10
- Installieren Sie die Abhängigkeit:
pip install -r requirements.txt
- 下载模型:从Hugging Face获取7B参数模型(约10GB)
Überprüfen der Installation
Führen Sie den Testbefehl aus:python inference.py --modal video --model_path ./HumanOmni_7B --video_path test.mp4
,成功输出视频描述即表示安装完成。
Diese Antwort stammt aus dem ArtikelHumanOmni: ein multimodales Makromodell zur Analyse menschlicher Videoemotionen und -handlungenDie