该模型在角色扮演场景的表现主要体现在三个维度:
1. 角色一致性
通过RLHF强化学习优化,能精准理解角色卡设定(背景/性格/台词风格),保持长期对话中角色行为的连贯性。例如输入”中世纪骑士”设定后,模型会自动采用古朴用语并保持骑士精神的行为模式。
2. 交互深度
- 支持多轮复杂对话(128k上下文)
- 能主动发展剧情线索
- 对模糊指令具有良好补全能力
3. 参数调控
通过调整temperature(0.3-1.0)控制回答创意度,repeat_penalty(1.0-1.5)防止内容重复。典型配置示例:--temp 0.7 --repeat_penalty 1.1
实际使用中建议:先明确定义角色基础设定(200-500字),再通过渐进式对话逐步丰富细节,模型会自动学习和维持角色特征。
本答案来源于文章《Tifa-Deepsex-14b-CoT:擅长角色扮演与超长小说生成的大模型》