Die zentrale Positionierung und technische Architektur von Genie 3
Genie 3 ist DeepMinds neuester Durchbruch in der KI, ein universelles Weltmodell, das die Gesetze der Welt versteht und simuliert. Im Gegensatz zu herkömmlichen KI-Modellen liegt der zentrale technologische Durchbruch darin, den Sprung von der statischen Inhaltsgenerierung zur dynamischen Umgebungssimulation zu schaffen. Das Modell besteht aus drei technischen Schlüsselkomponenten: 1) einem selbstlernenden System zum Verstehen physikalischer Gesetze auf der Grundlage massiver Videodaten, 2) einer 720p/24fps-Echtzeit-Rendering-Engine und 3) einem Szenenspeichermodul, das mehrere Minuten Interaktion unterstützt. Die Modellparameter umfassen Dutzende von Milliarden von Stufen, und die Trainingsdaten stammen aus öffentlichen Videoressourcen im Internet. Durch selbstgesteuertes Lernen hat es die grundlegende Sprache der Funktionsweise der Welt gemeistert, z. B. die Interaktion von Objekten und physikalische Gesetze.
Diese Antwort stammt aus dem ArtikelGenie 3: Generierung virtueller Welten, mit denen man in Echtzeit interagieren kannDie




























