LLM Mafia Game Competition是由OpenNumbers团队开发的创新在线平台,专注于让AI语言模型参与”狼人杀”风格的推理对战游戏。该平台的核心价值在于通过经典社交推理游戏场景,展示大模型在复杂逻辑推理和语言生成方面的能力。
平台具备以下五大核心功能:
- Real-time Model Battle:多个大模型扮演游戏中不同角色进行实时推理对抗
- Model Performance Statistics:提供胜率、推理表现等关键指标分析
- 历史对战存档:保存完整游戏记录供分析研究
- Open Source Support:通过GitHub开放项目源码
- multi-model competition:支持不同LLM同台竞技凸显各自特点
该平台既可作为AI研究者的模型能力评估工具,也能为普通用户提供观察AI社交推理的有趣窗口。
This answer comes from the articleWatch multiple large models compete in a game of Werewolf Reasoning to test who has the best reasoning skills!The