Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite

Genie 3 ist ein generisches Weltmodell (Weltmodell), das von Google DeepMind veröffentlicht wurde und den neuesten Fortschritt in der KI bei der Simulation und Erstellung virtueller Umgebungen darstellt. Das Hauptmerkmal dieses Modells ist, dass es eine vielfältige und dynamische Welt generieren kann, die Echtzeit-Interaktion auf der Grundlage einer einfachen Textbeschreibung unterstützt. Die Benutzer können in dieser von der KI generierten Welt navigieren und sie erkunden, wobei das Modell die nachfolgenden Szenen in Echtzeit mit 24 Bildern pro Sekunde rendert und die Kohärenz der Szene über mehrere Minuten aufrechterhält.Genie 3 simuliert nicht nur reale physikalische Phänomene wie Licht und Wasserfluss, sondern erzeugt auch fantasievolle fiktive Szenen und animierte Charaktere. Als "Weltmodell" zielt es darauf ab, zu verstehen und zu simulieren, wie die Welt funktioniert. Dies macht es nicht nur zu einem leistungsstarken Werkzeug für die Erstellung von Inhalten, sondern auch zu einem wichtigen Schritt beim Training von universellen KI-Intelligenzen (AGI), denen eine praktisch unbegrenzte Anzahl von Simulationsumgebungen zum Trainieren zur Verfügung steht.

Funktionsliste

  • Welt der TexterzeugungGenerieren Sie eine neue, handlungsfähige und dynamische Umgebung mit einfachen Textanweisungen.
  • Interaktives Erlebnis in EchtzeitDie Modelle werden mit einer Auflösung von 720p bei 24 Bildern pro Sekunde gerendert und reagieren auf die Aktionen des Benutzers.
  • Langfristige KonsistenzGenerierte Umgebungen können im Verlauf einer mehrminütigen Interaktion visuell und physisch konsistent bleiben, wobei die Szene auch dann intakt bleibt, wenn man einen Standpunkt vorübergehend verlässt und zu ihm zurückkehrt.
  • Analoge Physik und Natur: Die Fähigkeit, natürliche Phänomene wie Wasser, Licht und komplexe Umweltinteraktionen zu simulieren und Ökosysteme zu erzeugen, die das Verhalten von Pflanzen und Tieren berücksichtigen.
  • Fiktive Szenarien erstellenNicht nur auf die reale Welt beschränkt, sondern auf der Grundlage von Vorgaben fantasievolle Welten mit animierten Szenen, Fantasiewesen und künstlerischen Stilen (z. B. Origami-Stil) schaffen.
  • Raum-Zeit-ErkundungEin bestimmter geografischer Ort (z. B. Venedig) oder eine historische Szene (z. B. der antike griechische Palast von Knossos) kann für den Benutzer zur Erkundung erstellt werden.
  • Abrufbare WeltereignisseBenutzer können die Umgebung dynamisch verändern, indem sie Ereignisse in der Welt mit neuen Textbefehlen zusätzlich zur Navigation ändern, z. B. einen Bären oder einen Traktor zu einer bestehenden Szene hinzufügen.
  • Unterstützung für Smart Body TrainingDie generierte Umgebung kann als virtuelles Versuchsfeld für das Training von universellen KI-Intelligenzen wie SIMA verwendet werden, damit diese lernen, komplexe Aufgaben in verschiedenen Szenarien zu bewältigen.

Hilfe verwenden

Genie 3 ist derzeit für eine begrenzte Vorschau für ausgewählte Wissenschaftler und Kreative als Ergebnis von Spitzenforschung verfügbar und steht der Öffentlichkeit noch nicht zur Verfügung, so dass es keinen allgemeinen Installations- oder Registrierungsprozess gibt. Die Art und Weise, wie das Programm verwendet wird, ist ein neues interaktives Paradigma, das die Grenzen herkömmlicher Videoerstellungswerkzeuge durchbricht. Im folgenden Abschnitt werden die Funktionsweise und der vorgesehene Nutzungsprozess im Detail beschrieben.

Arbeitsprinzip

Das Herzstück von Genie 3 ist ein "Weltmodell", was bedeutet, dass es nicht nur eine Reihe von zusammenhängenden Bildern erzeugt, sondern versucht, die grundlegenden Regeln einer Welt zu verstehen und auf der Grundlage dieser Regeln vorherzusagen, wie das Verhalten eines Nutzers diese Welt verändern wird.

  1. autoregressive GenerierungAnstatt das gesamte Video auf einmal zu generieren, wenn Sie eine Aktion ausführen (z. B. vorwärts gehen), sagt Genie 3 das Video voraus und rendert es Bild für Bild, automatisch regressiv. Es bezieht sich auf Ihre vorherigen Bilder und Ihre neuen Bewegungen, um zu berechnen, wie das nächste Bild aussehen sollte. Dieser Prozess läuft mit sehr hoher Geschwindigkeit ab (24 Mal pro Sekunde), so dass es sich anfühlt, als würden Sie ein echtes Spiel spielen.
  2. Lernen Sie aus einer großen Anzahl von VideosUm diese leistungsstarke Fähigkeit zur Weltsimulation zu erlangen, lernte Genie 3 eine große Menge an Internetvideos ohne ausdrückliche Anweisungen. Indem es diese Videos ansah, lernte es selbstständig, wie die Welt funktioniert, einschließlich grundlegender physikalischer Gesetze (z. B. dass Objekte fallen), Interaktionen zwischen verschiedenen Objekten und die visuellen Merkmale einer bestimmten Umgebung.
  3. Gedächtnis und KonsistenzUm die virtuelle Welt real erscheinen zu lassen, verfügt Genie 3 über eine leistungsstarke Szenenspeicherfunktion. Wenn Sie einen Bereich erkunden, ihn verlassen und wiederkommen, muss sich das Modell daran erinnern, wie der Bereich vorher aussah. Genie 3 kann die Konsistenz der Szene bis zu mehreren Minuten aufrechterhalten, was ein großer technologischer Durchbruch ist, da sich bei der autoregressiven Generierung im Laufe der Zeit leicht Fehler ansammeln können.

Geplanter Nutzungsablauf

Wenn Sie Zugang zu Genie 3 haben, kann der Vorgang wie folgt aussehen:

Schritt 1: Erschaffe deine Welt durch Text

Zunächst müssen Sie Genie 3 eine Textaufforderung (Prompt) geben, die die von Ihnen gewünschte Welt in natürlicher Sprache beschreibt. Je detaillierter die Beschreibung ist, desto besser wird die generierte Welt Ihren Vorstellungen entsprechen.

Sie können zum Beispiel Folgendes eingeben:

"Ein friedlicher japanischer Zen-Garten, die Tageszeit ist der frühe Morgen bei klarem Himmel. Der Boden ist mit sorgfältig geharktem weißen Sand mit wirbelnden Mustern bedeckt. Der Garten hat einen kleinen ruhigen Teich mit rosa Seerosen, die auf der Oberfläche schwimmen. Ein paar glatte graue Felsen, auf denen Moos wächst, säumen die Landschaft.

Nachdem Sie die Eingabeaufforderung abgeschickt haben, zeigt Genie 3 den Startbildschirm der Welt an, in der Sie sich befinden und die Sie nun erkunden können.

Schritt 2: Navigation und Erkundung in Echtzeit

Sobald Sie die Welt betreten haben, können Sie die Pfeiltasten ähnlich wie bei einem Gamepad oder einer Tastatur verwenden, um Ihre Perspektive und Bewegung zu steuern.

  • 向前走Erkunden Sie die Tiefen des Gartens.
  • 向左/向右转Beobachten Sie die Aussicht aus verschiedenen Blickwinkeln.
  • 抬头/低头Bewundern Sie den Himmel oder beobachten Sie Details auf dem Boden.

Jede Aktion, die Sie ausführen, wird an das Modell gesendet, das einen neuen Bildschirm in Echtzeit berechnet und rendert. Der gesamte Prozess läuft reibungslos und ohne Verzögerungen ab, ganz so, als würden Sie ein hochauflösendes Open-World-Spiel spielen.

Schritt 3: Dynamische Veränderung der Welt durch "promptable world events".

Dies ist eine der revolutionärsten Funktionen von Genie 3. Während der Erkundung können Sie jederzeit die aktuelle Umgebung verändern oder neue Elemente durch neue Textbefehle einführen.

Angenommen, Sie befinden sich in einer Skiszene und können einen neuen Befehl eingeben:

"Ein Heißluftballon erscheint."

Genie 3 lässt einen Heißluftballon in den Himmel steigen, der sich natürlich in die Umgebung einfügt. Sie können auch dramatischere Veränderungen an der Welt vornehmen, z. B. das Wetter ändern.

In einer sonnigen Londoner Straßenszene könnten Sie zum Beispiel tippen:

"Es fängt an zu regnen."

Das Modell wird den Himmel verdunkeln und den Regen in Echtzeit rendern.

Diese Funktion erhöht die Freiheit der Interaktion und der Kreativität erheblich und macht den Nutzer vom "Beobachter" zum "Mitgestalter" der Welt.

Anwendungsszenario

  1. Spieleentwicklung
    Schnelles Umsetzen von Spielkonzepten in spielbare Prototypen. Entwickler können verschiedene Spielwelten und -ebenen mit bloßen Textbeschreibungen generieren, wodurch komplexe 3D-Modellierung und Szenario-Design von Grund auf überflüssig werden, was die Entwicklungszyklen drastisch verkürzt und die Kreativität fördert.
  2. AI Intelligent Body Training
    KI-Intelligenzen können in einer Vielzahl von virtuellen Welten, die von Genie 3 generiert werden, lernen zu navigieren, Aufgaben auszuführen und auf Notfälle zu reagieren, ohne in der teuren und riskanten realen Welt trainieren zu müssen.
  3. Kreative Medien und Erstellung von Inhalten
    Filmemacher, Animatoren und Künstler können mit Genie 3 schnell einzigartige visuelle Kulissen, Fantasieszenen oder Material für interaktive Geschichten erstellen. Seine Fähigkeit, Textbeschreibungen direkt in dynamische, interaktive visuelle Inhalte umzuwandeln, bietet ein völlig neues Werkzeug für den kreativen Ausdruck.
  4. Bildung und Ausbildung
    Erstellen Sie interaktive Simulatoren für das Lernen und die berufliche Weiterbildung. So kann zum Beispiel ein realistisches historisches Szenario erstellt werden, das Studenten erkunden können, oder eine komplexe Betriebsumgebung für Techniker simuliert werden, um Sicherheitstrainings durchzuführen, was ein intensiveres Lernerlebnis bietet als herkömmliche Bücher oder Videos.

QA

  1. Was ist Genie 3?
    Genie 3 ist ein von Google DeepMind entwickeltes Weltmodell, das eine dynamische virtuelle Welt generiert, die der Benutzer betreten und in der er in Echtzeit mit Hilfe von Textanweisungen navigieren und interagieren kann.
  2. Wie unterscheidet sich Genie 3 von normalen Modellen zur Videoerstellung wie Veo?
    Der größte Unterschied ist die "Echtzeit-Interaktivität". Gewöhnliche Videogenerierungsmodelle erzeugen auf Kommando einen kompletten, unveränderlichen Videoclip. Genie 3 erzeugt eine dynamische Umgebung, in der der Benutzer seine eigene Perspektive und sein eigenes Verhalten steuern kann, und die Ausgabe des Modells ändert sich in Echtzeit je nach den Aktionen des Benutzers, genau wie bei einem Spiel.
  3. Wie real ist die von Genie 3 erzeugte Welt?
    Genie 3 macht erhebliche Fortschritte in Bezug auf visuellen Realismus und physikalische Kohärenz. Es simuliert natürliche Phänomene wie Wasserfluss, Licht und Schatten und erhält die Konsistenz einer Szene über mehrere Minuten der Interaktion aufrecht. Das heißt, wenn Sie einen Ort erkunden, ihn verlassen und wieder zurückkehren, bleibt der Ort derselbe.
  4. Wer hat derzeit Zugang zu Genie 3?
    Derzeit ist Genie 3 nur als Forschungsvorschau für einige wenige Akademiker und Kreative verfügbar. Auf diese Weise hofft Google DeepMind, Feedback zu sammeln und die Technologie auf verantwortungsvolle Weise weiterzuentwickeln.
  5. Was sind die Grenzen von Genie 3?
    Genie 3 befindet sich noch in einem frühen Forschungsstadium und hat eine Reihe von Einschränkungen, darunter: die begrenzte Anzahl direkter Aktionen, die von den Intelligenzen ausgeführt werden können; die Schwierigkeit, komplexe Interaktionen zwischen mehreren Intelligenzen genau zu modellieren; die Unfähigkeit, reale geografische Standorte mit absoluter Genauigkeit nachzubilden; und die Dauer der Interaktionen, die derzeit auf einige Minuten begrenzt ist.
0Lesezeichen
0Gelobt

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang

de_DEDeutsch