海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

vllm-cli提供了哪些预设配置方案,各自有什么特点?

2025-08-21 32

vllm-cli内置了四种优化配置方案,针对不同使用场景进行了专门调优:

  • standard:默认配置,采用vLLM推荐的智能参数,适合大多数模型和一般使用场景
  • moe_optimized:专为混合专家(MoE)模型优化,调整了专家选择和路由的相关参数
  • high_throughput:最大化请求吞吐量的配置,适合需要高频调用模型的场景
  • low_memory:内存优化配置,自动启用FP8量化等技术,适合GPU内存有限的硬件环境

这些预设方案可以通过--profile参数快速调用。在实际开发中,建议先尝试standard配置,再根据具体需求选择其他优化方案或进行自定义参数调整。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文