Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Wie kann man WritingBench verwenden, um die Schreibfähigkeit von KI-Modellen zu bewerten?

2025-08-28 1.5 K

Die Bewertung mit WritingBench ist in die folgenden Hauptschritte unterteilt:

1. die Vorbereitung der Umwelt

Die Datei Requirements.txt muss manuell installiert werden, da sie nicht mit dem Projekt mitgeliefert wird:

  • Python 3.8+ Umgebung
  • Basisbibliotheken: Torch (GPU-Version empfohlen), Transformers, Requests usw.

2. der Zugang zu den Daten

Nach dem Klonen oder Herunterladen des ZIP-Pakets von GitHub:

  • Die Primärdaten werden in derbenchmark_all.jsonlPapiere
  • Enthält 1239 Aufgabenbeschreibungen, Referenzmaterialien und Benotungsrubriken

3. die Modellprüfung

Typischer Testablauf:

  1. Laden des Zielschreibmodells
  2. Aufgabenbeschreibung lesen, um Text zu erzeugen
  3. Speichern Sie die generierten Ergebnisse in response.txt

4. die Bewertung der Umsetzung

Zwei Möglichkeiten der Punktevergabe:

  • Großes Modell-Scoringllm.py ausführen, nachdem der API-Schlüssel von LLM konfiguriert wurde
  • Bewertung der ModellnotenSpezialisiertes Beurteilungsmodell für 7B-Parameter, die im Voraus heruntergeladen werden müssen

Die endgültige Ausgabe enthält detaillierte Bewertungsergebnisse in 5 Dimensionen (z.B. logisch, professionell, etc.), und die Bewertungskriterien können durch Modifizierung von prompt.py angepasst werden.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang