Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Wie schneidet MiroFlow bei den GAIA-Validierungsdaten ab?

2025-08-19 187

MiroFlow hat in den GAIA Validation Set Leistungstests eine hervorragende Leistung gezeigt:

  • Bei Verwendung von Claude Sonnet 3.7 als wichtigstes groß angelegtes Sprachmodell
  • Pass@1-Punktzahl von 72,21 TP3T, gemittelt über drei Durchgänge
  • Diese Leistung steht an der Spitze der Open-Source-Frameworks für intelligente Körper

MiroFlow legt besonderen Wert auf die Reproduzierbarkeit seiner Leistung, stellt vollständig offene Evaluierungsskripte und -profile zur Verfügung und veröffentlicht mehrere unabhängige GAIA-Trace-Läufe auf HuggingFace, um Transparenz und Zuverlässigkeit der Ergebnisse zu gewährleisten.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang

de_DEDeutsch