Fogsight ist ein Open-Source-KI-Tool zur Erzeugung von Animationen, das auf einem großen Sprachmodell (LLM) basiert. Es wandelt abstrakte Konzepte oder Wörter, die vom Benutzer eingegeben werden, in gut strukturierte Lehranimationen mit chinesischer und englischer Sprachausgabe um. Die Benutzer geben einfach ein Thema ein, wie z. B. "Bubble Sort" oder "Law of Entropy Increase", und Fogsight generiert automatisch Animationen, die Erzählungen, visuelle Elemente und Bewegungseffekte enthalten, um klare Lerninhalte zu präsentieren. Das Tool eignet sich für den Unterricht, die Populärwissenschaft und den kreativen Ausdruck. Es ist einfach zu bedienen und unterstützt die lokale Bereitstellung und mehrere Dialogrunden, um die Animationseffekte zu optimieren.Fogsight ist unter der MIT-Lizenz lizenziert und der Code ist auf GitHub öffentlich zugänglich, sodass Benutzer ihn frei verwenden und verändern können.
Funktionsliste
- Konzeptionelle RotationszeichnungGeben Sie ein Wort oder einen Begriff ein, und es wird automatisch eine Lernanimation mit chinesischer und englischer Synchronisation erstellt.
- Intelligente TerminplanungKI automatisiert die Erstellung von Voice-over, visuellen Elementen und Bewegungseffekten, um narrativ vollständige Animationen zu erzeugen.
- Sprachliche Benutzeroberfläche (LUI)Anpassung des animierten Inhalts, um die visuellen und sprachlichen Effekte durch mehrere Dialogrunden zu optimieren.
- Unterstützung für mehrere große Sprachmodelle: Google-kompatibel Zwillinge 2.5 und andere Modell-APIs zur flexiblen Anpassung an verschiedene LLMs.
- lokaler EinsatzUnterstützt die lokale Ausführung, schützt die Privatsphäre des Benutzers und ist für die Offline-Nutzung geeignet.
- Quelloffen und kostenlosBasierend auf der MIT-Lizenz ist der Code öffentlich zugänglich und kann von den Benutzern frei verändert und weitergegeben werden.
Hilfe verwenden
Einbauverfahren
Fogsight muss lokal implementiert werden. Hier sind die detaillierten Installationsschritte. Die Benutzer benötigen Python 3.9 oder höher, einen modernen Browser (wie Chrome, Firefox oder Edge) und einen API-Schlüssel für das große Sprachmodell (Google Gemini 2.5 wird empfohlen).
- Code-Repository klonen
Öffnen Sie ein Terminal und geben Sie den folgenden Befehl ein, um das Fogsight-Repository zu klonen:git clone https://github.com/fogsightai/fogsight.git cd fogsight
- Installation von Abhängigkeiten
Führen Sie im Projektverzeichnis den folgenden Befehl aus, um die erforderlichen Python-Bibliotheken zu installieren:pip install -r requirements.txt
- API-Schlüssel konfigurieren
Fogsight verwendet ein OpenAI-kompatibles SDK, empfiehlt aber einen API-Schlüssel für Google Gemini 2.5. Die Schritte sind wie folgt:- Kopieren Sie die Beispielkonfigurationsdatei:
cp demo-credentials.json credentials.json
- Compiler
credentials.json
Datei, geben Sie Ihren API-Schlüssel und die BASE_URL der API ein.
typisches Beispielcredentials.json
Format:{ "API_KEY": "your_api_key_here", "BASE_URL": "https://api.gemini.google.com/v2.5" }
- Speichern Sie die Datei, um den Schlüssel zu sichern.
- Kopieren Sie die Beispielkonfigurationsdatei:
- Neue Dienste
Führen Sie den folgenden Befehl aus, um den Backend-Dienst von Fogsight zu starten:python start_fogsight.py
Nach dem Start wird der Dienst automatisch im Browser geöffnet
http://127.0.0.1:8000
.
Verwendung
Nach dem Start des Dienstes bietet Fogsight eine einfache und intuitive Webschnittstelle. Nachfolgend finden Sie den Ablauf der wichtigsten Funktionen:
- Animation generieren
- In der Weboberfläche finden Sie das Eingabefeld.
- Geben Sie ein Thema oder ein Konzept ein, z. B. "Eulers Theorem" oder "Bubble Sort".
- Klicken Sie auf die Schaltfläche "Generieren" und AI generiert automatisch eine Animation mit chinesischer und englischer Sprachausgabe und dynamischen visuellen Effekten.
- Der Generierungsprozess kann je nach Komplexität des Themas und der Netzwerkgeschwindigkeit zwischen einigen Sekunden und einigen Minuten dauern.
- Optimierte Animation
- Fogsight unterstützt eine Sprachbenutzerschnittstelle (LUI), die es den Benutzern ermöglicht, Animationen über einen Dialog anzupassen.
- Klicken Sie in der Benutzeroberfläche auf die Schaltfläche "Anpassung" oder "Dialog", um den Dialogmodus aufzurufen.
- Geben Sie spezifische Anforderungen ein, wie z. B. "Mehr Farben hinzufügen" oder "Erzählung vereinfachen".
- Die KI erneuert die Animation auf der Grundlage des Feedbacks und wiederholt sie, bis sie zufrieden ist.
- Vorschau und Export
- Die generierte Animation kann direkt in der Weboberfläche in der Vorschau betrachtet werden.
- Unterstützt den Export in eine Videodatei (das spezifische Format hängt von der Version ab, in der Regel MP4).
- Die exportierten Animationen können für den Unterricht, die Weitergabe oder die weitere Bearbeitung verwendet werden.
caveat
- API-SchlüsselVergewissern Sie sich, dass Sie einen gültigen API-Schlüssel eingeben, sonst können Sie sich nicht mit dem Big Language Model verbinden.
- Lokale LeistungDie Erstellung komplexer Animationen kann hohe Rechenressourcen erfordern, daher wird empfohlen, einen Computer mit guter Leistung zu verwenden.
- NetzwerkumgebungLokale Bereitstellung erfordert keine Internetverbindung, aber wenn Sie die Online-API verwenden, müssen Sie ein stabiles Netzwerk unterhalten.
- Browser-KompatibilitätWir empfehlen, die neueste Version von Chrome oder Firefox zu verwenden, um eine optimale Nutzung zu gewährleisten.
Ausgewählte Funktionen
- Konzeptionelle RotationszeichnungDie Hauptfunktion von Fogsight besteht darin, abstrakte Konzepte zu visualisieren. Geben Sie z. B. den Satz "das Gesetz der zunehmenden Entropie" ein, und die KI erstellt eine Animation, die zeigt, wie die Entropie im Laufe der Zeit zunimmt, begleitet von einem leicht verständlichen Voiceover. Dies ist besonders nützlich, um komplexe akademische Konzepte in visuelle Inhalte zu verwandeln.
- Intelligente TerminplanungAI automatisiert jeden Teil der Animation, einschließlich Scripting, visuellem Design und Bewegungseffekten. Die Benutzer müssen keine Erfahrung mit Animationen haben, sie müssen nur ein Thema vorgeben.
- Sprachliche Benutzeroberfläche (LUI)Die Optimierung von Animationen durch Dialoge ist eine einzigartige Funktion von Fogsight. Die Benutzer können die KI auffordern, das Tempo, die Farbgebung oder den Erzählstil einer Animation anzupassen. Zum Beispiel: "Mach die Animation kinderfreundlicher" veranlasst die KI, eine sauberere, buntere Version zu erstellen.
- Open Source und lokale BereitstellungDer Code von Fogsight ist vollständig quelloffen, so dass die Nutzer ihn lokal ausführen können. Dies schützt nicht nur die Privatsphäre, sondern erleichtert es den Entwicklern auch, die Funktionalität an ihre Bedürfnisse anzupassen, z. B. neue visuelle Effekte hinzuzufügen oder andere Sprachmodelle zu unterstützen.
Anwendungsszenario
- Demonstration der Lehre
Lehrkräfte können Fogsight verwenden, um Animationen für Mathematik, Physik oder Informatik im Unterricht zu erstellen. Geben Sie zum Beispiel "Bubble Sort" ein, um eine Animation zu erstellen, die den Sortiervorgang visualisiert und den Schülern hilft, die Logik des Algorithmus zu verstehen. - Erstellung populärwissenschaftlicher Inhalte
Popularisierer können wissenschaftliche Begriffe wie "schwarzes Loch" oder "Quantenverschränkung" eingeben und schnell Animationen mit Kommentaren für den Einsatz in sozialen Medien oder Lehrvideos erstellen, um das Interesse der Zuschauer zu wecken. - Technische Ausbildung
Unternehmenstrainer können technologiebezogene Animationen für ihre Mitarbeiter erstellen, wie z. B. die "Principles of Blockchain", um komplexe Technologien auf visuelle Weise zu erklären und die Effektivität von Schulungen zu verbessern. - Persönlicher kreativer Ausdruck
Schöpfer können abstrakte Begriffe wie "Freiheit" oder "Zeit" eingeben, um künstlerische Animationen zur Verwendung in kurzen Videoplattformen oder Kunstprojektpräsentationen zu erstellen.
QA
- Welche Sprachen werden von Fogsight für die Erzählung unterstützt?
Die aktuelle Version unterstützt zweisprachige Erzählungen in Englisch und Chinesisch. Durch Beiträge aus der Community können in Zukunft weitere Sprachen unterstützt werden. - Ist Erfahrung im Bereich Animation erforderlich?
Nein. Fogsight ist so konzipiert, dass es einfach ist. Der Benutzer muss nur das Thema eingeben, und die KI erledigt alle Animationen automatisch. - Kann es offline verwendet werden?
Wenn Fogsight lokal eingesetzt wird, kann es komplett offline laufen, aber die Erzeugung von Animationen erfordert einen gültigen API-Schlüssel, um eine Verbindung zum großen Sprachmodell herzustellen. - Wie kann ich die Geschwindigkeit der Animationserstellung erhöhen?
Verwenden Sie einen leistungsfähigeren Computer oder optimieren Sie die Reaktionsgeschwindigkeit des API-Schlüssels. Auch die Gewährleistung eines stabilen Netzwerks kann die Generierungszeit verkürzen. - Ist Fogsight kostenpflichtig?
Fogsight selbst ist kostenlos und quelloffen und steht unter der MIT-Lizenz. Es können jedoch Kosten für die Nutzung der API für das große Sprachmodell anfallen.