LLM Mafia Game Competition是由OpenNumbers团队开发的创新在线平台,专注于让AI语言模型参与”狼人杀”风格的推理对战游戏。该平台的核心价值在于通过经典社交推理游戏场景,展示大模型在复杂逻辑推理和语言生成方面的能力。
平台具备以下五大核心功能:
- 实时模型对战:多个大模型扮演游戏中不同角色进行实时推理对抗
- 模型性能统计:提供胜率、推理表现等关键指标分析
- 历史对战存档:保存完整游戏记录供分析研究
- 开源代码支持:通过GitHub开放项目源码
- 多模型竞技:支持不同LLM同台竞技凸显各自特点
该平台既可作为AI研究者的模型能力评估工具,也能为普通用户提供观察AI社交推理的有趣窗口。
本答案来源于文章《观看多个大模型进行”狼人杀“推理游戏竞技,测验谁的推理能力更强!》