O sistema de avaliação da X-Dyna e o valor da democratização da tecnologia
O projeto X-Dyna não apenas abre o código-fonte do núcleo, mas também fornece um conjunto completo de sistema de avaliação de qualidade de animação de vídeo, que tem um significado de referência na atual comunidade de código-fonte aberto. O sistema contém quatro dimensões principais de avaliação: DTFVD (índice de fluência de tempo dinâmico), Face-Cos (retenção de características faciais), Face-Det (precisão de detecção de pontos-chave) e FID (indicadores de qualidade de geração). Entre elas, o DTFVD foi projetado especificamente para a suavidade das transições de ação entre quadros consecutivos e é calculado usando um algoritmo de consistência de fluxo óptico; o Face-Cos quantifica o grau de retenção de recursos faciais por meio de um modelo FaceNet pré-treinado. O projeto não apenas fornece scripts de avaliação, mas também conjuntos de dados de benchmarking de código aberto, permitindo que os pesquisadores reproduzam a pontuação de 0,91 do DTFVD relatada no artigo. Essa cadeia de ferramentas completa reduziu significativamente a barreira técnica para entrar no campo e, de acordo com o GitHub, levou a 23 projetos de pesquisa derivados.
Essa resposta foi extraída do artigoX-Dyna: Vídeo de referência de retrato estático Vídeo de geração de pose para fazer as fotos de Missy dançaremO































