Die 1239 sorgfältig zusammengestellten Schreibaufgaben von WritingBench decken eine Vielzahl von Berufsfeldern ab. Zu den 6 Hauptbereichen gehören: akademisches Schreiben, Geschäftsdokumente, juristische Dokumente, literarisches Schaffen, Bildungsmaterialien und Marketingtexte, die jeweils in 16-20 spezifische Anwendungsszenarien mit insgesamt bis zu 100 Unterbereichen unterteilt sind.
Ein besonderes Merkmal dieser Aufgaben ist ihre Authentizität und Praxisnähe. Sie umfassen beispielsweise spezifische Aufgaben wie das Verfassen einer Zusammenfassung für einen Quartalsfinanzbericht im geschäftlichen Bereich, das Aufsetzen von Vertragsbedingungen im juristischen Bereich und das Verfassen einer Zusammenfassung für eine wissenschaftliche Arbeit im akademischen Bereich. Jede Aufgabe wird von detaillierten Stil-, Formatierungs- und Längenanforderungen begleitet, mit durchschnittlich 1.546 Wörtern spezifischer Anweisungen pro Aufgabe, um sicherzustellen, dass die Ergebnisse die Fähigkeit des Modells, in realen Szenarien zu schreiben, genau widerspiegeln.
Diese Segmentierung und das quantitative Design machen ihn zu einem der umfassendsten Benchmarks für die Bewertung der Schreibfähigkeiten von Big Models in der heutigen Branche.
Diese Antwort stammt aus dem ArtikelWritingBench: ein Benchmark-Bewertungsinstrument zum Testen der Schreibfähigkeiten von großen ModellenDie































