M3-Agent的部署要求可分为基础配置和功能扩展两个层级:
- 核心硬件需求:
- 完整运行(含记忆生成):需1张A100(80GB显存)或4张RTX 3090
- 纯推理模式:至少16GB显存的GPU
- 存储空间:200GB以上可用空间
- Abhängigkeiten von der Umwelt:
- 基础环境:需执行setup.sh脚本配置基础依赖
- 记忆过程:需安装特定版本的transformers库和Qwen-Omni工具包
- 控制过程:要求transformers==4.51.0/vllm==0.8.4等精确版本
值得注意的是,视频处理阶段会生成多个中间文件:
1) FFmpeg切的30秒视频片段
2) speakerlab生成的人声特征
3) 最终的记忆图谱.pkl文件
建议使用SSD存储以提高I/O效率,对于长视频处理需预留额外缓存空间。
Diese Antwort stammt aus dem ArtikelM3-Agent:一个拥有长期记忆并能处理音视频的多模态智能体Die