Typische Risikoanalyse
Bei der Open-Source-VLM-Feinabstimmung treten häufig Probleme auf, wie z. B. explodierende/verschwindende Gradienten, Überanpassung und katastrophales Vergessen, und Maestro baut durch die folgenden Mechanismen ein Sicherheitsnetz auf:
Vorbeugende Maßnahmen
- GradientenbeschneidungAutomatische Überwachung und Begrenzung der Gradientenamplitude, wobei der Schwellenwert auf den empfohlenen Wert von 1,0 gesetzt wird
- Dynamische LernrateEinführung von Cosine Annealing Warm Restarts (CAWRs)
- RegularisierungspaketeDie Kombination label_smoothing=0.1 + dropout=0.2 ist standardmäßig aktiviert.
Sanierungsprogramme
- Automatisch, wenn eine Verlustanomalie festgestellt wird:
- Aussetzung der Ausbildung
- Rollback zum letzten normalen Kontrollpunkt
- Reduzierte Lernrate 50% fortgesetzt nach - Angebot
--debug-modeParameter gibt diagnostische Informationen wie Histogramme von Gradienten aus
bestes Verfahren
Empfohlen für Anfänger:
1. die Verwendung von Fertigformulierungen zu bevorzugen (maestro recipies list)
2. mit kleinräumigen Daten beginnen (Ergänzungen)--fast-dev-runParameter)
3. das Kochbuch benutzen
Diese Antwort stammt aus dem ArtikelMaestro: ein Tool zur Vereinfachung des Prozesses der Feinabstimmung von Modellen der gängigen visuellen Open-Source-SprachenDie































