O posicionamento central e a arquitetura técnica do Genie 3
O Genie 3 representa o mais recente avanço da DeepMind em IA, um modelo de mundo universal que compreende e simula as leis do mundo. Diferentemente dos modelos tradicionais de IA, sua principal inovação tecnológica está em conseguir passar da geração de conteúdo estático para a simulação dinâmica do ambiente. O modelo consiste em três componentes técnicos principais: 1) um sistema de compreensão de leis físicas de autoaprendizagem baseado em dados de vídeo em massa; 2) um mecanismo de renderização em tempo real de 720p/24 fps; e 3) um módulo de memória de cena que suporta vários minutos de interação. A magnitude dos parâmetros do modelo atinge dezenas de bilhões de níveis, e os dados de treinamento são provenientes de recursos públicos de vídeo na Internet. Por meio da aprendizagem autossupervisionada, ele domina a linguagem básica do funcionamento do mundo, como a interação de objetos e as leis físicas.
Essa resposta foi extraída do artigoGenie 3: Geração de mundos virtuais que podem ser interagidos em tempo realO































