Smart Spectrum AI hat kürzlich die nächste Generation seines Flaggschiff-Basismodells vorgestellt GLM-4.5
Das Modell ist für Anwendungen mit intelligenten Körpern (Agenten) konzipiert und ist in Hugging Face
im Gesang antworten ModelScope
Die Plattform ist synchron quelloffen und ihre Modellgewichte unterliegen der MIT-Lizenz.
Die Modellfamilie verwendet eine Mixed Expert (MoE) Architektur und enthält zwei Versionen:GLM-4.5
Die Gesamtzahl der Teilnehmer beträgt 355 Milliarden, mit 32 Milliarden Aktivierungsparametern;GLM-4.5-Air
Die Gesamtzahl der Teilnehmer beträgt 106 Milliarden, mit 12 Milliarden Aktivierungsparametern.MoE
Die Architektur ermöglicht es dem Modell, nur einen Teil des Expertennetzwerks während der Inferenz zu aktivieren, wodurch der tatsächliche Rechenaufwand erheblich reduziert wird, während die große Wissensskala erhalten bleibt, die der Schlüssel zu der hohen Effizienz ist, die das Modell erreichen kann.
Darüber hinaus bietet das Modell zwei Betriebsmodi: einen "Denkmodus" für komplexe Schlussfolgerungen und Toolaufrufe und einen "Nicht-Denkmodus" für sofortige Reaktionen. Auf der Kostenseite ist die API preislich konkurrenzfähig, wobei Hochgeschwindigkeitsversionen mit bis zu 100 Prozent generiert werden. tokens/秒
.
Gesamtleistung
GLM-4.5
Das Ziel ist es, die Fähigkeiten des schlussfolgernden Denkens, der Codierung und des intelligenten Körpers in einem einzigen Modell zu vereinen. Um die allgemeinen Fähigkeiten des Modells umfassend zu bewerten, wählte das Entwicklungsteam 12 für die Branche repräsentative Bewertungsmaßstäbe aus, die alles von Fachwissen (MMLU Pro
undAIME24
), Code-Erzeugung (SWE-Bench Verified
) bis hin zur komplexen Argumentation (GPQA
) in mehreren Dimensionen.
Abbildung: GLM-4.5-Leistung bei 12 umfassenden Benchmark-Tests
In den kombinierten Durchschnittsergebnissen dieser Vergleichstests ist dieGLM-4.5
Es steht an dritter Stelle der weltweiten Modelle und an erster Stelle der Open-Source-Modelle. Nach offiziellen Angaben liegt das Modell bei 15 Billionen token
Nach Abschluss der Vorschulung zu den allgemeinen Daten im Bereich des Codes, des Denkens und der Intelligenz auf den 8 Billionen token
Die Daten wurden gezielt für Schulungen verwendet, die durch intensives Lernen zu einer Kompetenzerweiterung führten.
Höhere Parametereffizienz
Was die parametrische Effizienz betrifft, so ist dieGLM-4.5
demonstriert die Vorteile seiner Architektur. Obwohl die Anzahl der Parameter geringer ist als DeepSeek-R1
im Gesang antworten Kimi-K2
und anderen Modellen, schneidet aber in mehreren Benchmarks besser ab.
Insbesondere bei der Messung der Fähigkeit von Modellen zur Lösung realer Softwareentwicklungsprobleme ist die SWE-Bench Verified
Ganz oben auf der Liste.GLM-4.5
Die Reihe befindet sich auf der "Pareto-Grenze" des Verhältnisses zwischen Leistung und Parametern. Das bedeutet, dass die Modelle der Reihe bei gleicher Parameterskala die beste verfügbare Leistung erzielen.
Abbildung: Leistung/Parameter-Verhältnis des Modells auf der SWE-Bench Verified-Liste
Kosten und Geschwindigkeit
Zusätzlich zur Leistung.GLM-4.5
Die Serie ist auch ein Durchbruch in Sachen Kosten und Effizienz. Der Preis für API-Aufrufe liegt bei nur 0,8 $ pro Million Eingaben. tokens
Leistung $2/Million tokens
Dieser Preis ist viel niedriger als bei einigen der gängigen Modelle auf dem Markt. Inzwischen gibt es auch Hochgeschwindigkeitsversionen mit bis zu 100 tokens/秒
Die Generierungsgeschwindigkeit ist in der Lage, die aktuellen Anforderungen an niedrige Latenzzeiten und hohe Gleichzeitigkeit zu erfüllen.
Abbildung: Vergleich der API-Preise für Mainstream-Modelle
Tests an realen Schauplätzen
Um zu bewerten GLM-4.5
Wirkung in realen Programmierszenarien zu testen, hat das F&E-Team es in die Claude Code
Rahmen, mit Claude-4-Sonnet
undKimi-K2
undQwen3-Coder
ie Modelle wurden anhand von 52 Programmieraufgaben aus sechs Entwicklungsbereichen verglichen.
Abb.: Vergleich der Testergebnisse von Smart Body-Szenarien mit echtem Code
Die Testergebnisse zeigten, dassGLM-4.5
Es zeichnet sich im Vergleich zu anderen Open-Source-Modellen durch die Zuverlässigkeit des Werkzeugaufrufs und der Aufgabenerledigung aus und kann als Werkzeug für die meisten Szenarien verwendet werden. Claude-4-Sonnet
von effektiven Alternativen, aber es gibt noch Raum für Verbesserungen der Gesamtfähigkeit. Um die Transparenz der Bewertung zu gewährleisten, wurden alle Testaufgaben und Flugbahnen der intelligenten Körper veröffentlicht.
Model Native Agent Scene
Full-Stack-Entwickler
GLM-4.5
Die Serie ist in der Lage, komplette Entwicklungsaufgaben zu übernehmen, so dass komplexere Anwendungen, Spiele und interaktive Webseiten mit natürlichsprachlichen Befehlen geschrieben werden können. Das Entwicklungsteam demonstrierte mehrere Beispiele von Anwendungen, die mit nur einem Befehl erstellt wurden und nun in der Z.ai
Die Website ist online und kann kostenlos genutzt werden.
Beispiel 1: Aufbau einer Suchmaschine
Anweisungen: "Machen Sie eine Google-Suchseite".
Erfahrung Adresse: https://n0x9f6733jm1-deploy.space.z.ai
Beispiel 2: Entwicklung einer Video-Website
Anweisungen: "Entwickeln Sie eine bilibili Web-Demo mit UI, Seiten umfassen: Startseite und Video Details..."
Erfahrung Adresse: https://n0dba6ce0e60-deploy.space.z.ai
Beispiel 3: Entwicklung einer Website für soziale Medien
Anweisungen: "Entwickeln Sie eine Weibo-Web-Demo mit UI, Seiten umfassen: Home und Profil..."
Erfahrung Adresse: https://v0rb06rruyf0-deploy.space.z.ai/
Auswirkungen von Artefakten
Modelle sind nicht nur gut in der Codeverarbeitung, sondern auch in der Datenverarbeitung und interaktiven Inhaltserstellung. Mit einem englischen Befehl kann ein Modell zum Beispiel die Three.js
im Gesang antworten JavaScript
Erstellen einer 3D
Visualisieren Sie einen Globus, oder machen Sie eine Flappy Bird
Stil-Minispiele.
Beispiel: Flappy Bird-Minispiel
Anweisungen: "Erstelle eine Webseite mit Three.js und JavaScript, die eine 3D-Welt mit Orten, die ich besucht habe, auf der Grundlage eines Arrays anzeigt. Durch Anklicken von Markierungen auf dem 3D-Globus wird ein Zoomeffekt animiert und detaillierte Reiseinformationen mit Fotos geöffnet."
Erfahrung Adresse: https://chat.z.ai/space/b0yb2613ybp0-art
PPT-Produktion
GLM-4.5
Es demonstrierte auch seine Fähigkeiten bei der Erstellung grafischer Inhalte. Im Gegensatz zu herkömmlichen KI-PPT-Tools, die auf auszufüllende Vorlagen angewiesen sind, sucht das Modell selbstständig nach Informationen, findet begleitende Bilder und generiert Inhalte direkt in HTML während des Produktionsprozesses. Dies gibt ihm die Flexibilität, Präsentationen, Bilder für soziale Medien oder Lebensläufe in verschiedenen Größenordnungen zu erstellen.
Wie zu verwenden
GLM-4.5
Tiefgreifend optimiert für umfassende Programmier- und Tool-Aufruf-Funktionen, kompatibel mit dem Claude Code
undCline
undRoo Code
und andere gängige Code Intelligence Body Frameworks.
- Open Source Repository.
https://github.com/zai-org/GLM-4.5
- Modell Warehouse.
HuggingFace
:https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
ModelScope
:https://modelscope.cn/collections/GLM-45-b8693e2a08984f
- Online-Erfahrung.
HuggingFace
:https://huggingface.co/spaces/zai-org/GLM-4.5-Space
ModelScope
:https://modelscope.cn/studios/ZhipuAI/GLM-4.5-Demo