Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Nachrichten

GLM-4.5 Open Source Release: Eine neue Generation von Vorzeigemodellen für intelligente Körperanwendungen

2025-07-28 29

Bild

Smart Spectrum AI hat kürzlich die nächste Generation seines Flaggschiff-Basismodells vorgestellt GLM-4.5Das Modell ist für Anwendungen mit intelligenten Körpern (Agenten) konzipiert und ist in Hugging Face im Gesang antworten ModelScope Die Plattform ist synchron quelloffen und ihre Modellgewichte unterliegen der MIT-Lizenz.

Die Modellfamilie verwendet eine Mixed Expert (MoE) Architektur und enthält zwei Versionen:GLM-4.5 Die Gesamtzahl der Teilnehmer beträgt 355 Milliarden, mit 32 Milliarden Aktivierungsparametern;GLM-4.5-Air Die Gesamtzahl der Teilnehmer beträgt 106 Milliarden, mit 12 Milliarden Aktivierungsparametern.MoE Die Architektur ermöglicht es dem Modell, nur einen Teil des Expertennetzwerks während der Inferenz zu aktivieren, wodurch der tatsächliche Rechenaufwand erheblich reduziert wird, während die große Wissensskala erhalten bleibt, die der Schlüssel zu der hohen Effizienz ist, die das Modell erreichen kann.

Darüber hinaus bietet das Modell zwei Betriebsmodi: einen "Denkmodus" für komplexe Schlussfolgerungen und Toolaufrufe und einen "Nicht-Denkmodus" für sofortige Reaktionen. Auf der Kostenseite ist die API preislich konkurrenzfähig, wobei Hochgeschwindigkeitsversionen mit bis zu 100 Prozent generiert werden. tokens/秒.

Gesamtleistung

GLM-4.5 Das Ziel ist es, die Fähigkeiten des schlussfolgernden Denkens, der Codierung und des intelligenten Körpers in einem einzigen Modell zu vereinen. Um die allgemeinen Fähigkeiten des Modells umfassend zu bewerten, wählte das Entwicklungsteam 12 für die Branche repräsentative Bewertungsmaßstäbe aus, die alles von Fachwissen (MMLU ProundAIME24), Code-Erzeugung (SWE-Bench Verified) bis hin zur komplexen Argumentation (GPQA) in mehreren Dimensionen.

Bild
Abbildung: GLM-4.5-Leistung bei 12 umfassenden Benchmark-Tests

In den kombinierten Durchschnittsergebnissen dieser Vergleichstests ist dieGLM-4.5 Es steht an dritter Stelle der weltweiten Modelle und an erster Stelle der Open-Source-Modelle. Nach offiziellen Angaben liegt das Modell bei 15 Billionen token Nach Abschluss der Vorschulung zu den allgemeinen Daten im Bereich des Codes, des Denkens und der Intelligenz auf den 8 Billionen token Die Daten wurden gezielt für Schulungen verwendet, die durch intensives Lernen zu einer Kompetenzerweiterung führten.

Höhere Parametereffizienz

Was die parametrische Effizienz betrifft, so ist dieGLM-4.5 demonstriert die Vorteile seiner Architektur. Obwohl die Anzahl der Parameter geringer ist als DeepSeek-R1 im Gesang antworten Kimi-K2 und anderen Modellen, schneidet aber in mehreren Benchmarks besser ab.

Insbesondere bei der Messung der Fähigkeit von Modellen zur Lösung realer Softwareentwicklungsprobleme ist die SWE-Bench Verified Ganz oben auf der Liste.GLM-4.5 Die Reihe befindet sich auf der "Pareto-Grenze" des Verhältnisses zwischen Leistung und Parametern. Das bedeutet, dass die Modelle der Reihe bei gleicher Parameterskala die beste verfügbare Leistung erzielen.

Bild
Abbildung: Leistung/Parameter-Verhältnis des Modells auf der SWE-Bench Verified-Liste

Kosten und Geschwindigkeit

Zusätzlich zur Leistung.GLM-4.5 Die Serie ist auch ein Durchbruch in Sachen Kosten und Effizienz. Der Preis für API-Aufrufe liegt bei nur 0,8 $ pro Million Eingaben. tokensLeistung $2/Million tokensDieser Preis ist viel niedriger als bei einigen der gängigen Modelle auf dem Markt. Inzwischen gibt es auch Hochgeschwindigkeitsversionen mit bis zu 100 tokens/秒Die Generierungsgeschwindigkeit ist in der Lage, die aktuellen Anforderungen an niedrige Latenzzeiten und hohe Gleichzeitigkeit zu erfüllen.

Bild
Abbildung: Vergleich der API-Preise für Mainstream-Modelle

Tests an realen Schauplätzen

Um zu bewerten GLM-4.5 Wirkung in realen Programmierszenarien zu testen, hat das F&E-Team es in die Claude Code Rahmen, mit Claude-4-SonnetundKimi-K2undQwen3-Coder ie Modelle wurden anhand von 52 Programmieraufgaben aus sechs Entwicklungsbereichen verglichen.

Bild
Abb.: Vergleich der Testergebnisse von Smart Body-Szenarien mit echtem Code

Die Testergebnisse zeigten, dassGLM-4.5 Es zeichnet sich im Vergleich zu anderen Open-Source-Modellen durch die Zuverlässigkeit des Werkzeugaufrufs und der Aufgabenerledigung aus und kann als Werkzeug für die meisten Szenarien verwendet werden. Claude-4-Sonnet von effektiven Alternativen, aber es gibt noch Raum für Verbesserungen der Gesamtfähigkeit. Um die Transparenz der Bewertung zu gewährleisten, wurden alle Testaufgaben und Flugbahnen der intelligenten Körper veröffentlicht.

Model Native Agent Scene

Full-Stack-Entwickler

GLM-4.5 Die Serie ist in der Lage, komplette Entwicklungsaufgaben zu übernehmen, so dass komplexere Anwendungen, Spiele und interaktive Webseiten mit natürlichsprachlichen Befehlen geschrieben werden können. Das Entwicklungsteam demonstrierte mehrere Beispiele von Anwendungen, die mit nur einem Befehl erstellt wurden und nun in der Z.ai Die Website ist online und kann kostenlos genutzt werden.

Beispiel 1: Aufbau einer Suchmaschine

Anweisungen: "Machen Sie eine Google-Suchseite".
Erfahrung Adresse: https://n0x9f6733jm1-deploy.space.z.ai

Beispiel 2: Entwicklung einer Video-Website

Anweisungen: "Entwickeln Sie eine bilibili Web-Demo mit UI, Seiten umfassen: Startseite und Video Details..."
Erfahrung Adresse: https://n0dba6ce0e60-deploy.space.z.ai

Beispiel 3: Entwicklung einer Website für soziale Medien

Anweisungen: "Entwickeln Sie eine Weibo-Web-Demo mit UI, Seiten umfassen: Home und Profil..."
Erfahrung Adresse: https://v0rb06rruyf0-deploy.space.z.ai/

Auswirkungen von Artefakten

Modelle sind nicht nur gut in der Codeverarbeitung, sondern auch in der Datenverarbeitung und interaktiven Inhaltserstellung. Mit einem englischen Befehl kann ein Modell zum Beispiel die Three.js im Gesang antworten JavaScript Erstellen einer 3D Visualisieren Sie einen Globus, oder machen Sie eine Flappy Bird Stil-Minispiele.

Beispiel: Flappy Bird-Minispiel

Anweisungen: "Erstelle eine Webseite mit Three.js und JavaScript, die eine 3D-Welt mit Orten, die ich besucht habe, auf der Grundlage eines Arrays anzeigt. Durch Anklicken von Markierungen auf dem 3D-Globus wird ein Zoomeffekt animiert und detaillierte Reiseinformationen mit Fotos geöffnet."
Erfahrung Adresse: https://chat.z.ai/space/b0yb2613ybp0-art

PPT-Produktion

GLM-4.5 Es demonstrierte auch seine Fähigkeiten bei der Erstellung grafischer Inhalte. Im Gegensatz zu herkömmlichen KI-PPT-Tools, die auf auszufüllende Vorlagen angewiesen sind, sucht das Modell selbstständig nach Informationen, findet begleitende Bilder und generiert Inhalte direkt in HTML während des Produktionsprozesses. Dies gibt ihm die Flexibilität, Präsentationen, Bilder für soziale Medien oder Lebensläufe in verschiedenen Größenordnungen zu erstellen.

Foto
Foto
Foto
Foto
Foto
Foto
Foto
Foto
Foto

Wie zu verwenden

GLM-4.5 Tiefgreifend optimiert für umfassende Programmier- und Tool-Aufruf-Funktionen, kompatibel mit dem Claude CodeundClineundRoo Code und andere gängige Code Intelligence Body Frameworks.

  • Open Source Repository. https://github.com/zai-org/GLM-4.5
  • Modell Warehouse.
    • HuggingFacehttps://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
    • ModelScopehttps://modelscope.cn/collections/GLM-45-b8693e2a08984f
  • Online-Erfahrung.
    • HuggingFacehttps://huggingface.co/spaces/zai-org/GLM-4.5-Space
    • ModelScopehttps://modelscope.cn/studios/ZhipuAI/GLM-4.5-Demo

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

Posteingang

Kontakt

zurück zum Anfang

de_DEDeutsch