A tecnologia Soul ID da Higgsfield AI alcançou um avanço na captura de recursos dinâmicos de personagens por meio de um modelo de rede neural criado a partir do treinamento de fotos em vários ângulos. Depois que o usuário carrega mais de 10 fotos contendo diferentes microexpressões, condições de iluminação e ângulos, o modelo 3D baseado em expressões construído pelo sistema pode restaurar com precisão mais de 93% características de movimento muscular facial. Os dados de teste mostram que a imagem virtual gerada atinge ±1,2 graus na curvatura da precisão do ângulo da boca, e o desvio da trajetória de rotação do globo ocular é inferior a 2,3 pixels, e esses parâmetros estão próximos do padrão de precisão de reconhecimento do Face ID do iPhone 14 Pro.
Os cenários de aplicação dessa tecnologia incluem:
- Controle em tempo real de 52 expressões básicas implementadas no Digital Split Live
- Mantém o erro de sincronização labial em menos de 0,1 segundo na dublagem de vídeo em vários idiomas
- Mantém a consistência do material da cor da pele em diferentes condições de iluminação até RGB ΔE<3
Em testes A/B realizados em 2023, os vídeos explicativos de comércio eletrônico gerados com o Soul ID aumentaram o tempo de permanência do usuário em 171 TP3T em relação aos vídeos de ação ao vivo.
Essa resposta foi extraída do artigoHiggsfield AI: uso de IA para gerar vídeos fotorrealistas e avatares personalizadosO































