基本操作プロセス
1. ウェブサイトへのアクセスブラウザを開き、次のサイトにアクセスする。 エージェント・リーダーボード,无需注册即可浏览排行榜。
2. 查看默认排名:首页默认展示当前排名前 17 的 LLM 模型,包括模型名称、供应商、得分、成本等信息。
筛选与对比步骤
- 按供应商筛选:例如选择“OpenAI”,可过滤出 GPT-4o 等模型。
- 按类型筛选:可区分开源模型(如 Mistral)与私有模型(如 Gemini)。
- 按得分区间筛选:例如仅查看 TSQ 得分高于 0.85 的模型。
- 成本排序:点击“Cost”列可按价格升序/降序排列,快速找到性价比最高的选项。
この答えは記事から得たものである。エージェント・リーダーボード:AIエージェントのパフォーマンス評価リーダーボードについて