テキストの繰り返しをなくすための4ステップ・プログラム
Tifa-Deepsex-14b-CoTが重複して生成される可能性がある問題に対しては、以下のような対策の組み合わせが考えられます:
- バージョン選択: Tifa-Deepsex-14b-CoT-Chatバージョンは、重複防止のために特別に訓練された30KのDPOデータを含んでいるため、好ましい。
- パラメータの組み合わせ::
パラメトリック 推奨値 は英語の -ity、-ism、-ization に対応する。 リピート・ペナルティ 1.2-1.5 重複トークンにペナルティを課す トップ・ケー 40 サンプリングの多様性 トップ 0.95 品質と多様性のバランス - キュー・ワード・エンジニアリング例えば、システムプロンプトに明示的な指示を含める:
"请避免重复使用相同的句式结构和形容词,保持词汇多样性" - 再処理方法連続する段落の類似度が0.7を超えると自動的に再生成が行われる、余弦類似度に基づくフィルタリングスクリプトを開発する。
この答えは記事から得たものである。Tifa-Deepsex-14b-CoT:ロールプレイングと超長編小説の生成に特化した大型モデル。について




























