Um guia prático para otimizar as palavras-chave
Uma estratégia de otimização em três níveis é recomendada para o problema de viés de conteúdo:
- Método de descrição estruturadaEscreva prompts de acordo com a estrutura "sujeito-ação-ambiente-estilo", por exemplo, "Golden Retriever (sujeito) correndo na praia (ação), pôr do sol (ambiente), textura de filme 8k (estilo)".
- Modo aprimorado GPT-4oAtivar o parâmetro -refine-prompt True, o sistema expandirá automaticamente os prompts simples em prompts longos que incluem terminologia como ângulos de câmera, iluminação etc.
- Técnicas de estímulo negativoAdicionar unprompted.txt ao arquivo de configuração para definir elementos excluídos, por exemplo, "rosto desfocado, distorcido, membros extras".
- Validação em etapasSr. em um vídeo de visualização de 2 segundos (-num-frames 17) para confirmar a direção antes de gerar a versão completa
- Gráfico de referência bloqueadoImagem para o modo de vídeo, use -ref-strength 0,7 para preservar a composição original; quanto maior o valor, mais recursos da imagem de referência serão preservados
Essa resposta foi extraída do artigoOpen Sora: uma ferramenta de geração de vídeo de código aberto para otimizar a consistência facialO