MiroFlow hat in den GAIA Validation Set Leistungstests eine hervorragende Leistung gezeigt:
- Bei Verwendung von Claude Sonnet 3.7 als wichtigstes groß angelegtes Sprachmodell
- Pass@1-Punktzahl von 72,21 TP3T, gemittelt über drei Durchgänge
- Diese Leistung steht an der Spitze der Open-Source-Frameworks für intelligente Körper
MiroFlow legt besonderen Wert auf die Reproduzierbarkeit seiner Leistung, stellt vollständig offene Evaluierungsskripte und -profile zur Verfügung und veröffentlicht mehrere unabhängige GAIA-Trace-Läufe auf HuggingFace, um Transparenz und Zuverlässigkeit der Ergebnisse zu gewährleisten.
Diese Antwort stammt aus dem ArtikelMiroFlow: ein Rahmen für den Aufbau, die Verwaltung und die Skalierung von KI-IntelligenzenDie