作为Tifa系列的稳定版,Deepsex-14b-CoT-Chat采用业界领先的三重防护设计:
- Filtragem de dados:训练集经过Claude-4和GPT-4双轮内容审核,有害内容过滤率达99.7%
- RLHF强化:30K DPO数据专门针对政治敏感话题进行对齐,违规响应率控制在0.3%以下
- 动态监测:输出层集成神经网络卫士模块,实时检测并阻断不符合规定的生成内容
同时保留0.4T高质量小说语料的创作能力,在安全测试中取得S级评分的同时,角色扮演生动性仍保持89分(满分100)的行业顶尖水平。
Essa resposta foi extraída do artigoTifa-Deepsex-14b-CoT: um modelo grande especializado em interpretação de papéis e geração de ficção ultralongaO