Como evitar que o Open-Sora gere conteúdo que não corresponda às palavras do prompt?

2025-08-25

1.4 K

Um guia prático para otimizar as palavras-chave

Uma estratégia de otimização em três níveis é recomendada para o problema de viés de conteúdo:

Método de descrição estruturadaEscreva prompts de acordo com a estrutura "sujeito-ação-ambiente-estilo", por exemplo, "Golden Retriever (sujeito) correndo na praia (ação), pôr do sol (ambiente), textura de filme 8k (estilo)".
Modo aprimorado GPT-4oAtivar o parâmetro -refine-prompt True, o sistema expandirá automaticamente os prompts simples em prompts longos que incluem terminologia como ângulos de câmera, iluminação etc.
Técnicas de estímulo negativoAdicionar unprompted.txt ao arquivo de configuração para definir elementos excluídos, por exemplo, "rosto desfocado, distorcido, membros extras".
Validação em etapasSr. em um vídeo de visualização de 2 segundos (-num-frames 17) para confirmar a direção antes de gerar a versão completa
Gráfico de referência bloqueadoImagem para o modo de vídeo, use -ref-strength 0,7 para preservar a composição original; quanto maior o valor, mais recursos da imagem de referência serão preservados