Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

Como otimizar a velocidade de inferência do DeepSeek-R1 WebGPU localmente?

2025-09-10 3.2 K

Metodologia de otimização de desempenho

A capacidade de resposta do modelo depende do desempenho da GPU do dispositivo e da alocação de recursos do navegador, e pode ser aprimorada das seguintes maneiras:

Guia de operação

  • Configuração da aceleração de hardwareConfigurações do Chrome→Sistema→Ativar "Usar aceleração de hardware".
  • Definição de prioridades de recursosProcesso WebGPU: defina o processo WebGPU como de alta prioridade no gerenciador de tarefas do navegador (Shift+Esc)
  • Otimização dos parâmetros de cálculoReduzir o valor do parâmetro max_new_tokens (pode ser aberto em versões futuras)
  • Programa de isolamento ambientalFechar outras páginas da Web/plug-ins que consomem recursos da GPU

Programa Avançado

Os desenvolvedores podem forçar a especificação de um dispositivo de GPU modificando o devicePreference na configuração do transformers.js ou usar o OffscreenCanvas para renderização em segundo plano.

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

voltar ao topo