Histórico da otimização de desempenho
O OpenCharacter é baseado em uma pilha de tecnologia da Web moderna e pode ser mantido em funcionamento sem problemas em ambientes com recursos limitados...
Estratégia de otimização do núcleo
- Seleção de modelos::
- É dada preferência a versões quantificadas de modelos menores (por exemplo, versões de 4 bits do phi-3-mini)
- Defina MODEL_SIZE="small" no arquivo de configuração de tempo de execução local (.env)
- Compartilhamento de carga na nuvem::
- Habilitando o cache de computação de borda com a Cloudflare
- Configurar cache_ttl=3600 em wrangler.toml
- Otimização de front-end::
- Usar o Bun em vez do Node.js para acelerar a instalação de dependências
- Ativar a compactação SWC em next.config.js
- Otimização do banco de dados::
- Limitar o número de entradas do histórico de bate-papo armazenadas (a configuração padrão é 50)
- Executar comandos de limpeza do banco de dados D1 regularmente
Dicas especiais
- Use -port 3001 no modo de desenvolvimento para evitar conflitos com outros serviços
- Reduzir o uso de recursos desativando a visualização ao vivo
- Habilite a aceleração da WebGPU em seu navegador
Essa resposta foi extraída do artigoOpenCharacter: a alternativa de código aberto e sem censura ao Character.AIO































