Análise de risco típica
O ajuste fino do VLM de código aberto geralmente encontra problemas como explosão/desaparecimento de gradientes, ajuste excessivo e esquecimento catastrófico, e o Maestro cria uma rede de segurança por meio dos seguintes mecanismos:
Medidas preventivas
- corte gradienteMonitoramento automático e limitação da amplitude do gradiente, com o limite definido para o valor recomendado de 1,0
- Taxa de aprendizado dinâmicoAdoção de Cosine Annealing Warm Restarts (CAWRs)
- Pacotes de regularização: a combinação label_smoothing=0.1 + dropout=0.2 é ativada por padrão
Programas de remediação
- Automaticamente quando uma anomalia de perda é detectada:
- Suspensão do treinamento
- Reversão para o ponto de verificação normal mais recente
- Taxa de aprendizado reduzida 50% continuou após - oferta
--debug-modeO parâmetro gera informações de diagnóstico, como histogramas de gradientes
melhores práticas
Recomendado para iniciantes:
1. priorizar o uso de formulações prontas (maestro recipies list)
2. começando com dados de pequena escala (adições)--fast-dev-runparâmetros)
3. usando o livro de receitas
Essa resposta foi extraída do artigoMaestro: uma ferramenta para simplificar o processo de ajuste fino dos modelos das principais linguagens visuais de código abertoO































