LLM Mafia Game Competition是由OpenNumbers团队开发的创新在线平台,专注于让AI语言模型参与”狼人杀”风格的推理对战游戏。该平台的核心价值在于通过经典社交推理游戏场景,展示大模型在复杂逻辑推理和语言生成方面的能力。
平台具备以下五大核心功能:
- Batalha de modelos em tempo real:多个大模型扮演游戏中不同角色进行实时推理对抗
- Estatísticas de desempenho do modelo:提供胜率、推理表现等关键指标分析
- 历史对战存档:保存完整游戏记录供分析研究
- Suporte a código aberto:通过GitHub开放项目源码
- competição multimodelo:支持不同LLM同台竞技凸显各自特点
该平台既可作为AI研究者的模型能力评估工具,也能为普通用户提供观察AI社交推理的有趣窗口。
Essa resposta foi extraída do artigoVeja vários modelos grandes competirem em um jogo de raciocínio de lobisomem para testar quem tem as melhores habilidades de raciocínio!O