海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする
現在の場所図頭 " AIアンサー

WritingBenchは大規模なモデルの自動採点と特殊なルーブリックモデルの採点の両方をサポートしています。

2025-08-28 1.4 K

WritingBenchは評価結果の信頼性を保証するために二重の評価メカニズムを提供する。一つ目は大規模モデルに基づく自動採点システムで、ユーザはevaluator/llm.py設定ファイルを編集し、独自のAPIエンドポイントにアクセスすることで採点機能を実現できる。2つ目は、Qwen-7Bモデルに基づく専用の判定モデルスコアリングシステムであり、ユーザはそれを使用する前にHuggingFaceプラットフォームから特定のモデルをダウンロードする必要があります。

どちらの評価も標準化された5項目の採点基準を使用し、採点範囲は0〜10です。評価スクリプトは、各基準のスコアと、「内容の完全性:8/10、核となる要素をカバーしているが、いくつかの詳細が欠けている」といった詳細なフィードバックのような具体的な根拠を自動的に出力します。

この2トラック設計は、評価の効率性を考慮し、採点の質を保証するもので、ユーザーは実際のニーズに応じて最適な評価方法を柔軟に選択することができる。

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

トップに戻る

ja日本語