Capacidade de geração de consistência em várias funções
O 1Prompt1Story é excelente na geração de vários caracteres. Enquanto os modelos tradicionais de texto para imagem são propensos à confusão de identidade ao lidar com vários caracteres, a ferramenta garante que cada caractere mantenha sua própria identidade exclusiva por meio de um design inovador do mecanismo de atenção.
As técnicas específicas de realização incluem:
- Alocação de atenção hierárquica: processamento independente de vetores de recursos para diferentes funções
- Fusão de recursos cruzados: possibilitando interações naturais entre personagens em um nível semântico de alto nível
- Reforço de recursos contrastivos: aprimorando a diferenciação entre funções
Os testes práticos mostram que o sistema produz consistentemente imagens de várias funções com clara diferenciação de identidade em 200 conjuntos de dicas de 8 superclasses no teste de referência Consistory+.
Essa resposta foi extraída do artigoOne-Prompt-One-Story: os prompts de texto geram imagens consistentes de identidade de personagemO































