当前位置：首页 » AI答疑

如何使用MCPMark进行模型评估？具体步骤是什么？

2025-08-28

283

MCPMark评估流程详解

使用MCPMark进行模型评估通常包含四个关键步骤：

根据前文描述完成工具安装和环境配置

为需要测试的服务(GitHub/Notion等)配置API访问权限

全量测试：python -m pipeline --exp-name 实验名 --mcp 环境 --tasks all --models 模型名 --k 尝试次数
分组测试：可指定特定任务组如online_resume

每次实验都会生成JSON和CSV格式的详细报告，支持多种指标的多维度分析。