海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

如何安装和配置DeepEP的开发环境?

2025-09-05 1.2 K

基础环境准备

  • 硬件需求:NVIDIA H800等支持NVLink/RDMA的GPU
  • 网络要求:InfiniBand 400Gb/s以上
  • 软件依赖:CUDA 11+/NCCL/Python 3.8+

分步安装指南

  1. 克隆源码库:git clone https://github.com/deepseek-ai/DeepEP.git
  2. 安装修改版NVSHMEM(需应用补丁文件)
  3. 执行编译:make生成内核文件
  4. 设置环境变量:
    • export NVSHMEM_IB_SL=0
    • export NVSHMEM_ENABLE_ADAPTIVE_ROUTING=1(限低延迟模式)

验证安装

运行测试脚本:python tests/test_low_latency.py

预期输出应包含:

  • All-to-all通信成功标志
  • 各GPU间的带宽测试结果
  • 时延统计信息

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文