Como executar a inferência de modelo no gpt-oss-recipes?

2025-08-19

278

As etapas para executar a inferência de modelo no gpt-oss-recipes são as seguintes:

Modelos de carregamento e divisores: UsoAutoModelForCausalLMresponder cantandoAutoTokenizerCarregue o modelo especificado (por exemploopenai/gpt-oss-20b).
prompt de entradaDefinir mensagens do usuário (por exemplo"如何用Python写一个排序算法？"), e por meio deapply_chat_templatepara processar a entrada.
Gerar resultados: Chamadamodel.generategera a resposta e decodifica a saída usando um divisor.
Ajuste dos parâmetros de inferência (opcional)O nível de detalhe do raciocínio pode ser ajustado pelos prompts do sistema, por exemplo, definindo a opção"Reasoning: high"para gerar um processo de raciocínio mais detalhado.

Os scripts de exemplo de raciocínio geralmente estão localizados no diretórioinference.pyo modelo retornará os resultados gerados após a execução.

Ferramenta de IA da estação de consulta rápida