Szenariobasierte Lösungen zur Effektoptimierung
Die folgenden Optimierungsstrategien können für verschiedene Anwendungsszenarien angewandt werden:
- Ein einziges Diagramm, das die Szene darstellt::
- Erhöhung des Anteils der durch das Bild in sft_vlm_data.jsonl beschriebenen Proben
- Anpassung des Temperaturparameters zur Steuerung der Erzeugungsvielfalt
- Fügen Sie der Aufforderung "Bitte beschreiben Sie dieses Bild ausführlich" hinzu.
- Q&A-Szenario::
- Sammeln von bereichsspezifischen QA-Daten zur Ergänzung des Mikrotuning-Sets
- Ändern Sie den Parameter max_seq_len in LMConfig.py, um den Kontext zu erweitern
- Beispiel für die Verwendung von Fresh-Shot-Prompting
- Szenarien mit mehreren Graphen für Schlussfolgerungen::
- Vergrößerung der Datenmenge von sft_vlm_data_multi.jsonl
- Anpassen der Positionseinbettung für visuelle Token
- Hinzufügen einer eindeutigen Angabe der Bildreihenfolge in der Eingabe
Allgemeine Optimierungsvorschläge: 1) Erhöhen Sie die Trainingsepoche für dieselben Daten 2) Versuchen Sie eine mittelgroße Konfiguration mit dim=768 3) Verwenden Sie die Balkensuche, um die Generierungsqualität zu verbessern. Das Projekt web_demo_vlm.py verfügt über ein integriertes Tool zur Bewertung der Auswirkungen, mit dem die Optimierungseffekte in Echtzeit getestet werden können.
Diese Antwort stammt aus dem ArtikelMiniMind-V: 1 Stunde Training von 26M parametrischen visuellen SprachmodellenDie































