海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

Tifa-Deepsex-14b-CoT不同版本间有哪些关键区别?

2025-09-10 3.5 K

该模型存在三个主要变体版本:

1. 基础版(Tifa-Deepsex-14b-CoT)

  • 研究测试性质
  • RL奖励算法初期验证
  • 输出灵活但可控性低

2. Chat版(Tifa-Deepsex-14b-CoT-Chat)

  • 采用标准训练数据(0.4T小说+112K SFT数据)
  • 集成DPO强化学习防重复
  • 政治安全性增强
  • 平衡发散性与稳定性

3. Crazy版(Tifa-Deepsex-14b-CoT-Crazy)

  • 基于671B满血R1蒸馏数据
  • 文学创作能力突出
  • 继承R1模型的发散特性
  • 增量训练数据达502K条

普通用户推荐使用Chat版,研究型用户可选择基础版,专业写作者可尝试Crazy版获取更富创意的文本输出。

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文