3 maneiras de resolver inconsistências de caráter
Ao usar a Tifa-Deepsex-14b-CoT em cenários de interpretação de papéis, garantir a consistência do personagem requer otimização em três níveis: configurações de entrada, ajuste de parâmetros e pós-processamento:
- Definir o histórico do personagem em detalhesInclua explicitamente a história de fundo do personagem, os traços de personalidade e as diretrizes de comportamento no prompt, com um formato sugerido de "Você é um [identidade], personalidade [descrição], hábito [ação] e está em [cena] no momento". Por exemplo, "Você é um conde vampiro de alta tensão que fala com elegância, mas de forma ameaçadora, tem o hábito de bater os dedos em sua taça de vinho e está recebendo visitantes no castelo no momento."
- Ajuste do parâmetro Generation (Geração)Para o formato GGUF, use o comando:
./main -m model.gguf --temp 0.7 --repeat_penalty 1.1 -p "你的角色提示词" - Habilitar o controle de versão seguroPriorizar a versão Tifa-Deepsex-14b-CoT-Chat em relação à versão Crazy, pois ela é treinada no aprendizado de reforço de DPO e mantém melhor a consistência da função
Se ainda ocorrerem desvios, a saída poderá ser filtrada pelo código front-end:content.replace(/<think>.*?</think>/gis, '').replace(/[与角色不符的内容]/g, '')
Essa resposta foi extraída do artigoTifa-Deepsex-14b-CoT: um modelo grande especializado em interpretação de papéis e geração de ficção ultralongaO































