Como implantar o modelo dots.llm1?

2025-08-20

222

Opções de implementação

O dots.llm1 oferece uma variedade de métodos de implementação para diferentes cenários de uso.

Instalação do Docker e do kit de ferramentas para contêineres da NVIDIA
Execute o seguinte comando para extrair a imagem:
docker run -gpus all -v ~/.cache/huggingface:/root/.cache/huggingface -p 8000:8000 -ipc=host rednotehilab/dots1. vllm-openai-v0.9.0.1 -model rednote-hilab/dots.llm1.base -tensor-parallel-size 8 -trust-remote-code -served-model-name dots1
Use o curl para testar se o serviço está funcionando

Instale a dependência:
pip install transformers torch
Carregamento de modelos e divisores:
from transformers import AutoTokenizer, AutoModelForCausalLM
model_name = 'rednote-hilab/dots.llm1.base'
model = AutoModelForCausalLM.from_pretrained(nome_do_modelo)

Adequado para cenários de raciocínio em grande escala:
vllm serve rednote-hilab/dots.llm1.base -port 8000 -tensor-parallel-size 8