Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

Quais opções de configuração predefinidas o vllm-cli oferece e quais são os recursos de cada uma delas?

2025-08-21 46

O vllm-cli tem quatro cenários de configuração otimizados incorporados, especificamente ajustados para diferentes cenários de uso:

  • padrãoConfiguração padrão com parâmetros inteligentes recomendados pelo vLLM, adequados para a maioria dos modelos e cenários de uso geral
  • moe_optimisedOtimizado para o modelo Mixed Expert (MoE), com parâmetros ajustados relacionados à seleção e ao roteamento de especialistas
  • alta_produçãoConfiguração para maximizar a taxa de transferência de solicitações, adequada para cenários que exigem invocação de alta frequência do modelo
  • baixa_memóriaConfigurações otimizadas para memória, com tecnologias como a quantificação de FP8 ativada automaticamente, para ambientes de hardware com memória de GPU limitada

Esses programas predefinidos podem ser acessados por meio do--profileChamada rápida de parâmetros. No desenvolvimento prático, é recomendável tentar primeiro ostandarde, em seguida, selecionar outras opções de otimização ou fazer ajustes de parâmetros personalizados de acordo com necessidades específicas.

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

voltar ao topo

pt_BRPortuguês do Brasil