Como a versão estável da série Tifa, o Deepsex-14b-CoT-Chat apresenta um design de proteção tripla líder do setor:
- Filtragem de dadosO conjunto de treinamento foi submetido a duas rodadas de auditoria de conteúdo por Claude-4 e GPT-4, com uma taxa de filtragem de conteúdo nocivo de 99,7%
- Aprimoramento da RLHF: 30K Os dados do DPO são especificamente alinhados a tópicos politicamente sensíveis, com uma taxa de resposta de violação controlada em menos de 0,31 TP3T
- Monitoramento dinâmicoIntegração de um módulo de proteção de rede neural na camada de saída para detectar e bloquear conteúdo gerado fora de conformidade em tempo real
Ao mesmo tempo em que mantém a capacidade de criar um corpus fictício de alta qualidade de 0,4T, a vivacidade da interpretação de papéis permanece no topo do setor, com 89 de 100, e obtém uma classificação S no teste de segurança.
Essa resposta foi extraída do artigoTifa-Deepsex-14b-CoT: um modelo grande especializado em interpretação de papéis e geração de ficção ultralongaO































