Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Wie lässt sich OpenBench in den CI/CD-Prozess für automatisierte Tests integrieren?

2025-08-19 246

Spezifische Szenarien für die Einbindung von OpenBench in ein kontinuierliches Integrationssystem:

  1. Setzen Sie die Umgebungsvariable API-Schlüssel in der CI-Konfiguration (z. B.OPENAI_API_KEY)
  2. Verwenden Sie ein Docker-Image oder installieren Sie die uv/OpenBench-Umgebung direkt
  3. Schreiben von Testskripten und Beispielen:bench eval mmlu --model 待测模型 --json > results.json
  4. Parsing von JSON-Ergebnissen mit Hilfe von Tools wie jq, Festlegen von Genauigkeitsschwellenwerten zur Auslösung von Build-Fehlern (z. B. <80%)
  5. Empfohlen wird die gleichzeitige AusführunghumanevalCodierung von Tests undaimeMathe-Tests sind eine mehrdimensionale Bewertung
  6. Archivieren Sie historische Ergebnisse in CI-Artefakten für einfache Leistungsvergleiche zwischen Versionen.

Dieses Verfahren eignet sich besonders für Regressionstests nach der Feinabstimmung des Modells, um Probleme mit Leistungseinbußen rechtzeitig zu erkennen.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang

de_DEDeutsch