Basic operation process
1. Access to the website: Open your browser and visit Agent Leaderboard,无需注册即可浏览排行榜。
2. 查看默认排名:首页默认展示当前排名前 17 的 LLM 模型,包括模型名称、供应商、得分、成本等信息。
筛选与对比步骤
- 按供应商筛选:例如选择“OpenAI”,可过滤出 GPT-4o 等模型。
- 按类型筛选:可区分开源模型(如 Mistral)与私有模型(如 Gemini)。
- 按得分区间筛选:例如仅查看 TSQ 得分高于 0.85 的模型。
- 成本排序:点击“Cost”列可按价格升序/降序排列,快速找到性价比最高的选项。
This answer comes from the articleAgent Leaderboard: AI Agent Performance Evaluation RankingsThe