Kürzlich kündigte Smart Spectrum AI seine GLM-4.5
Reihe von Modellen in die Open-Source-Reihe aufgenommen, wodurch die Open-Source-Gemeinschaft für große Sprachmodelle wiederbelebt wird. Das Open-Source-Projekt besteht hauptsächlich aus zwei Modellen, die auf der Mixed-Expert-Architektur (MoE) basieren. Diese ermöglicht es den Modellen, ihre Gesamtparametergröße effizient zu skalieren und gleichzeitig die Rechenkosten niedrig zu halten, indem nur ein Teil der Experten (d. h. ein Teil des neuronalen Netzes) während des Inferenzprozesses aktiviert wird.
Die beiden veröffentlichten Modelle sind:
- GLM-4.5-355BDie Gesamtzahl der Teilnehmer beläuft sich auf 355 Milliarden und die Zahl der aktivierten Teilnehmer auf 32 Milliarden.
- GLM-4.5-LuftDie Gesamtzahl der Teilnehmer beläuft sich auf 106 Milliarden und die Zahl der aktivierten Teilnehmer auf 12 Milliarden.
Auf einer parametrischen Skala.GLM-4.5
Das Design der Website zeigt ein Streben nach Effizienz. Zum Beispiel ist die Gesamtzahl der Teilnehmer mit 355 Milliarden ungefähr DeepSeek-R1
die Hälfte von und Kimi-K2
von einem Drittel.
Leistungsbenchmarking und Preisstrategie
Was die Leistungsbewertung betrifft.GLM-4.5
Einschließlich MMLU Pro
undAIME24
undMATH 500
im Gesang antworten SWE-Bench Verified
Er schneidet in 12 öffentlichen Benchmarks gut ab, darunter der Die kombinierten Durchschnittswerte zeigen, dassGLM-4.5
Es steht an dritter Stelle unter den globalen Modellen und an erster Stelle sowohl in der Kategorie der einheimischen als auch der Open-Source-Modelle. Insbesondere die Fähigkeit zur Codebehebung, die in der Kategorie SWE-Bench
Die hervorragende Leistung bei diesen maßgeblichen Benchmarks ist ein gutes Vorzeichen für ihre mögliche Anwendung in der Softwareentwicklung.
Was die Preise für API-Aufrufe angeht, so ist dieGLM-4.5
Es wird ein gestaffeltes Preismodell verwendet. Wenn die Anzahl der Eingabe-Token im Bereich von 0-32k und die Anzahl der Ausgabe-Token im Bereich von 0-0,2k liegt, beträgt der Preis $0,8/Millionen Token für die Eingabe und $2/Millionen Token für die Ausgabe.Wenn die Anzahl der Eingabe-Token auf den Bereich von 32k-128k ansteigt, ist die Preisstrategie dieselbe wie die der Deepseek R1
im Gesang antworten Kimi k2
und andere Modelle, die man sich ansehen kann.
Darüber hinaus weist die Hochgeschwindigkeitsversion des Modells in Praxistests eine Generierungsgeschwindigkeit von bis zu 100 Token/Sekunde auf, was ein wichtiger Vorteil für Anwendungsszenarien ist, die eine Interaktion in Echtzeit erfordern.
Mehrdimensionale Code-Fähigkeit im Praxistest
Um zu überprüfen GLM-4.5
Codegenerierungsfähigkeiten und Designästhetik in realen Anwendungen, vergleichen wir es mit zwei anderen branchenbekannten Modellen, dem von Dark Side of the Moon entwickelten Kimi K2
und AliCloud haben die Qwen3 Coder
-... führte eine Reihe von gegenseitigen Prüfungen durch.
Test 1: Modernisierte Generierung der Login-Seite
Die erste ist eine grundlegende Front-End-Entwicklungsaufgabe, die darauf abzielt, die Fähigkeit des Modells zur Generierung regulärer Webkomponenten zu bewerten.
Test-Stichwörter:
Bitte erstellen Sie eine modernisierte Anmeldeseite mit den folgenden Funktionen:
- Eingabefeld für Mailbox und Passwort
- Anmeldeschaltfläche
- Optionen "An mich erinnern" und "Passwort vergessen".
- Google Drittanbieter-Anmeldung
- Link zur Registrierung
Anforderungen: dunkles Thema, futuristischer technischer Stil, zentriertes Layout, gute Benutzerfreundlichkeit.
Alle drei Modelle haben erfolgreich voll funktionsfähige Anmeldeseiten mit grundlegenden Interaktionseffekten erstellt. Jedes hat seinen eigenen Schwerpunkt in Bezug auf den Designstil, dieQwen3 Coder
Das Farbschema ist auffälliger, und die GLM-4.5
im Gesang antworten Kimi K2
Es werden auch qualitativ hochwertige Realisierungen angeboten.
Test 2: Animierte Wetterkarten
Der zweite Test erhöhte die Komplexität der Interaktion zwischen CSS-Animation und JavaScript mit der Aufgabe, eine animierte Wetterkarte zu erstellen, die dynamisch mehrere Wetterbedingungen anzeigt.
Test-Stichwörter:
Erstellen Sie eine einzelne HTML-Datei, die CSS und JavaScript enthält, um eine animierte Wetterkarte zu erzeugen. Die Karte sollte die folgenden Wetterbedingungen mit unterschiedlichen Animationen visuell darstellen. Die Karte sollte die folgenden Wetterbedingungen mit unterschiedlichen Animationen visuell darstellen.
Wind: (z. B. sich bewegende Wolken, schwankende Bäume oder Windlinien)
Regen: (z. B. fallende Regentropfen, Pfützenbildung)
Sonne: (z. B. leuchtende Strahlen, heller Hintergrund)
Schnee: (z. B. fallende Schneeflocken, sich ansammelnder Schnee)
Zeigen Sie alle Wetterkarten nebeneinander.
Die Karte sollte einen dunklen Hintergrund haben.
Stellen Sie den gesamten HTML-, CSS- und JavaScript-Code in einer einzigen Datei bereit. Das JavaScript sollte eine Möglichkeit enthalten, zwischen den verschiedenen Wetterbedingungen zu wechseln. Das JavaScript sollte eine Möglichkeit enthalten, zwischen den verschiedenen Wetterbedingungen zu wechseln.
Bei diesem Test wird dieGLM-4.5
Die Leistung der Karte ist viel besser. Die erzeugten Karten sind nicht nur flüssig animiert, sondern auch in den Details der Benutzeroberfläche (UI) verfeinert, und das Gesamtdesign ist ästhetisch ansprechender.
Test 3: High Fashion Magazine Style Wissenskarten
Um die Fähigkeiten des Modells in Bezug auf Design und Ästhetik weiter zu bewerten, wurde eine speziellere Aufgabe gestellt, bei der das Modell die Rolle eines führenden internationalen Art-Direktors eines digitalen Magazins übernehmen und eine futuristische, von der Technik inspirierte Wissenskarte entwerfen sollte.
Test-Stichwörter:
Sie sind ein führender internationaler Art Director für digitale Zeitschriften und Experte für Front-End-Entwicklung, der digitale Layouts für Modemagazine wie Vogue und Elle entworfen hat und sich darauf spezialisiert hat, die Ästhetik von Luxusmagazinen mit modernem Webdesign zu verbinden, um beeindruckende visuelle Erlebnisse zu schaffen.
Mandate
Bitte verwenden Sie Futuristic Tech, um Wissenskarten im Stil eines High-Fashion-Magazins zu entwerfen, die tägliche Informationen in einem raffinierten und luxuriösen Magazin-Layout präsentieren und den Nutzern das visuelle Vergnügen bieten, in einem High-End-Magazin zu blättern.
- Datumsbereich: stellt das aktuelle Datum in einer für jeden Stil einzigartigen Weise dar
- Überschriften und Zwischenüberschriften: Anpassung von Schriftart, Größe und Typografie an den jeweiligen Stil
- Zitierblock: Entwerfen Sie einen eigenen Zitierstil, der die Merkmale des Stils widerspiegelt.
- Aufzählung von Kernpunkten: Darstellung des Listeninhalts in einer stilgerechten Weise
- Anmerkung/Tipp des Herausgebers: Gestalten Sie es so, dass es zum Stil der Seitenleiste oder des Kommentars passt.
Technische Daten:
* 使用HTML5、Font Awesome、Tailwind CSS和必要的JavaScript
* FontAwesome: [https://lf6-cdn-tos.bytecdntp.com/cdn/expire-100-M/font-awesome/6.0.0/css/all.min.css](https://lf6-cdn-tos.bytecdntp.com/cdn/expire-100-M/font-awesome/6.0.0/css/all.min.css)
* Tailwind CSS: <https://lf3-cdn-tos.bytecdntp.com/cdn/expire-1-M/tailwindcss/2.2.19/tailwind.min.css>
* 中文字体: [https://fonts.geekzu.org/css2?family=Noto+Serif+SC:wght@400;500;600;700&family=Noto+Sans+SC:wght@300;400;500;700&display=swap](https://fonts.geekzu.org/css2?family=Noto+Serif+SC:wght@400;500;600;700&family=Noto+Sans+SC:wght@300;400;500;700&display=swap)
- Erwägen Sie das Hinzufügen subtiler kinetischer Effekte wie Einblendungen beim Laden der Seite oder subtiles Hovering-Feedback
- Sicherstellung eines sauberen und effizienten Codes mit Schwerpunkt auf Leistung und Wartungsfreundlichkeit
- Verwendung von CSS-Variablen zur Verwaltung von Farben und Abständen für einen einheitlichen Stil
- Für den flüssigen digitalen Morphismus-Stil müssen flüssige dynamische Effekte und Gradientenübergänge hinzugefügt werden
- Für einen ultrasensiblen, minimalistischen Stil muss jeder Pixel und jedes subtile interaktive Feedback präzise kontrolliert werden
- Für den neo-expressionistischen Stil der Datenvisualisierung ist es wichtig, die Daten visuell in das Design zu integrieren.
Leistungsanforderungen:
- Der Code sollte elegant sein und den besten Praktiken entsprechen, und CSS sollte ein Höchstmaß an Detailgenauigkeit aufweisen.
- Entworfen für eine Breite von 440px und eine Höhe von nicht mehr als 1280px
- Abstrahieren und Verfeinern des Themas, indem nur die Spaltenpunkte oder die zentralsten Satzzitate gezeigt werden, um die Lektüre lohnend zu machen
- Die Ausgabe erfolgt stets in Chinesisch, doch können dekorative Elemente auch in anderen Sprachen wie Französisch und Englisch verwendet werden, um sie eindrucksvoll zu gestalten.
Mit dem Weitblick und den ästhetischen Standards eines internationalen Top-Magazin-Art-Direktors sollten Sie digitale Karten im Stil eines Magazins entwerfen, die sich in ihrem Stil unterscheiden, aber ebenso atemberaubend sind, so dass die Nutzer das Gefühl haben, dass es sich nicht nur um eine gewöhnliche Informationskarte handelt, sondern um ein Stück digitaler Sammlerkunst".
Kimi K2
zusammen mit Qwen3 Coder
Die Generierungsergebnisse sind wie folgt:
Bei diesem Vergleich wird dieGLM-4.5
Die Vorteile werden noch deutlicher. Die von ihr erzeugte Karte unterstreicht nicht nur wirkungsvoll das futuristische Gefühl durch den leuchtenden Hintergrund mit einem harmonischen Farbschema, sondern sie ist vor allem das einzige Modell, das interaktive Elemente in sein Design einbezieht. Wenn man mit der Maus über die Karte fährt, erhält man eine entsprechende Rückmeldung, was das Benutzererlebnis verbessert.
Test 4: Spiel 3D Bricks
Der abschließende Test ist eine komplexe Aufgabe, bei der das Modell mit Hilfe der Three.js
Erstellen Sie ein vollständig mausgesteuertes 3D-Spiel zum Zerbrechen von Ziegelsteinen, das die Fähigkeit des Modells untersucht, eine Kombination aus Spiellogik, Physik-Engine und visuellen Effekten zu handhaben.
Test-Stichwörter:
"Erstelle ein 3D-Brick-Busting-Spiel, das ausschließlich mit der Maus gesteuert wird:
- Verwenden Sie Three.js, um eine immersive 3D-Szene mit den folgenden Kernkomponenten zu erstellen: ein links-rechts gleitendes Spielerpaddel: gesteuert durch horizontale Mausbewegungen; eine hüpfende Kugel mit physikalischen Eigenschaften: mäßige Anfangsgeschwindigkeit, die dem Gesetz der Reflexion nach der Kollision folgt; und Reihen von farbigen, schwebenden Steinen: verschiedene Farben entsprechen verschiedenen Punktzahlen.
- Anforderungen an den physikalischen Effekt: Kollisionserkennung: Präzise Kollision der Kugel mit Steinen/Leitblechen/Grenzen; dynamischer Rückprall: Kollisionen an verschiedenen Positionen des Leitblechs verändern den horizontalen Rückprallwinkel der Kugel; Schwerkraftsimulation: Die Flugbahn der Kugel hat die Form einer natürlichen Parabel
- Spielmechanik: Punktesystem: Echtzeitwertung für das Zerschlagen von Ziegeln (normale Ziegel = 10 Punkte, goldene Ziegel = 50 Punkte); Lebenswert: Anfangs 3 Leben, Leben werden abgezogen, wenn der Ball auf den Boden fällt; Geschwindigkeitsentwicklung: Für jeweils 10 zerschlagene Ziegel wird die Ballgeschwindigkeit um 15% erhöht
- Visuelle Effekte: Partikelexplosion beim Zertrümmern von Ziegeln; dynamischer Schlepplichteffekt, der der Flugbahn der Kugel hinzugefügt wurde; ringförmige Schockwellenanimation beim Aufprall des Pralltellers.
- Interaktionsverbesserungen: Echtzeit-Anzeige des Spielstands und des Lebenswerts (HUD); Spielende-Bildschirm mit Anzeige des endgültigen Spielstands + Neustart-Button; Hinzufügen von Kollisions-Soundeffekten (mit Web Audio API)"
In Bezug auf die endgültige RealisierungGLM-4.5
Die generierten Spiele waren am besten spielbar, wiesen die höchste Vollständigkeit der Spiellogik auf und generierten die wenigsten Fehler, was einmal mehr seine führende Fähigkeit zur Bewältigung komplexer Codegenerierungsaufgaben unter Beweis stellt.
Zusammengenommen.GLM-4.5
Es hat eine starke Kombination von Stärken bei der Codegenerierung gezeigt, insbesondere bei Aufgaben, die Designästhetik und komplexe Interaktionen kombinieren. Seine einmalige Erfolgsrate bei der Codegenerierung und seine Fähigkeit, Details zu kontrollieren, machen es zu einem leistungsstarken Open-Source-Modell, das die Aufmerksamkeit der Entwickler verdient.