ロールプレイング・シナリオにおけるモデルのパフォーマンスは、3つの主要な次元によって特徴づけられる:
1.役割の一貫性
RLHF強化学習によって最適化されたこのモデルは、キャラクターカードの設定(背景/性格/セリフのスタイル)を正確に理解し、長期的な会話におけるキャラクターの行動の一貫性を維持することができます。例えば、「中世の騎士」という設定を入力すると、モデルは自動的に古風な言葉を採用し、騎士道精神あふれる行動パターンを維持します。
2.インタラクティブな深さ
- 複数ラウンドの複雑な対話をサポート(128kコンテキスト)
- 筋書きを積極的に展開する能力
- ファジー・コマンドの補完能力に優れている
3.パラメーター規制
回答創造性のレベルは、コンテンツの重複を防ぐために、temperature(0.3-1.0)とrepeat_penalty(1.0-1.5)を調整することで制御されます。典型的な設定例--temp 0.7 --repeat_penalty 1.1
実際には、まず基本的なキャラクター設定(200~500語)を明確にし、段階的な対話を通じて細部を徐々に充実させ、モデルが自動的にキャラクターの特徴を学習し、維持することが推奨される。
この答えは記事から得たものである。Tifa-Deepsex-14b-CoT:ロールプレイングと超長編小説の生成に特化した大型モデル。について































