Auf der Grundlage der multimodalen Unterstützung von Portkey können intelligente Bildungslösungen in vier Schritten aufgebaut werden:
- Modell KonfigurationHinzufügen von Vision-fähigen Modellen (z.B. GPT-4V, LLaVA) zum Gateway und Hochladen von API-Schlüsseln für jedes Modell.
- Mix-and-Match-AnrufPython SDK verwenden, um sowohl Text- als auch Bildparameter zu übergeben (z.B. Foto für eine Matheaufgabe + eine Textaufforderung, um "diese Aufgabe Schritt für Schritt zu lösen").
- Optimierung der Ergebnisse:: Entwurf von Vorlagen für fachspezifische Prompts durch das Prompts-Modul ("Sie sind Mathematiklehrer, erklären Sie auf eine Weise, die Mittelschüler verstehen können...")
- Zustellung des EinsatzesBereitstellung von Servern auf dem Campus mit der Open-Source-Version oder Erreichen einer geografischen Abdeckung durch die Unternehmensversion des Cloud-Dienstes
RealisierungEine Online-Bildungsplattform mit Hilfe dieses Programms:
- Erkennungsgenauigkeit der Bildfrage von 92%
- Erhöhen Sie die Reaktionsgeschwindigkeit in Spitzenzeiten um das Dreifache durch Lastausgleich
- Intelligente Zwischenspeicherung, um Antworten auf dieselben Themen weniger kostspielig zu machen 65%
Die Architektur eignet sich besonders für die Korrektur von Hausaufgaben, die Analyse von Laborberichten und andere Szenarien, die eine Kombination aus grafischem und textuellem Verständnis erfordern.
Diese Antwort stammt aus dem ArtikelPortkey: ein Entwicklungswerkzeug für die Verbindung mehrerer KI-Modelle und die Verwaltung von AnwendungenDie































