Derzeitige Position:Abb. Anfang » AI-Nachrichten

DeepSeek-R1-Lite, ein selbst entwickeltes Inferenzmodell vergleichbar mit o1-preview, ist online!

2024-11-21

2.5 K

Gestern veröffentlichte DeepSeek DeepSeek-R1Eine Vorschau auf -Lite, ein Programm, das mit dem o1 konkurrierende Makro-Sprachmodelle für autonomes Denken und präsentiert den Nutzern einen vollständigen Denkprozess, den o1 nicht veröffentlicht.

Ähnlich wie die o1-Vorschau von OpenAI hat die DeepSeek-R1-Lite-Vorschau über die Aufgabe nachgedacht, vorausgeplant und eine Reihe von Aktionen durchgeführt, um dem Modell zu helfen, die Antwort zu finden, und sie hat den gesamten Denkprozess gezeigt.DeepSeek-R1-Lite wurde mithilfe von Reinforcement Learning trainiert, und der Denkprozess beinhaltet eine Menge Reflexion und Validierung, mit Gedankenketten, die zehntausende von Wörtern lang sind. Der Denkprozess umfasst viele Überlegungen und Überprüfungen, und die Gedankenketten sind zehntausende von Wörtern lang, was ihn effizienter macht. Zurzeit unterstützt es nur die Verwendung im Internet, und die offizielle Version wird vollständig quelloffen sein.

媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线-1

DeepSeek-R1-Lite Preview schneidet in Mathematik, Code und komplexen logischen Denkaufgaben besser ab als o1-preview. In renommierten Tests wie AIME, dem höchsten Schwierigkeitsgrad des US-Mathematikwettbewerbs AMC, und codeforces, dem weltweit führenden Programmierwettbewerb, übertrifft es den o1-preview und andere Modelle.

Führen Sie den einfachen "Erdbeertest" durch, und Sie werden eine perfekte Antwort erhalten.

Je nach Komplexität der Frage kann DeepSeek-R1 mehrere Dutzend Sekunden lang "nachdenken", bevor er antwortet, und Nutzer haben berichtet, dass sie für dieselbe Frage länger brauchten als o1. Offiziell gilt: Je länger die Denkkette ist, desto genauer sind die Ergebnisse.

Verschiedene Tests wurden online durchgeführt, und DeepSeek macht es auch leicht, einen Jailbreak durchzuführen - nämlich durch Eingabeaufforderungen, die die Sicherheitsmaßnahmen ignorieren. Ein X-Nutzer brachte DeepSeek-R1-Lite dazu, ein detailliertes Rezept für Gift zu geben, indem er spezielle Jailbreak-Prompts schrieb.

Natürlich hatte DeepSeek-R1-Lite in Online-Tests immer noch jede Menge Patzer und schnitt vor allem bei Tic-Tac-Toe und anderen logischen Aufgaben schlecht ab, ebenso wie o1.

Loggen Sie sich auf chat.deepseek.com ein und wählen Sie im Eingabefeld den Modus "Deep Thinking", um mit der DeepSeek-R1-Lite-Vorschau zu sprechen. Der "Deep Thinking"-Modus ist speziell für komplexe logische Fragestellungen in Mathematik, Code usw. konzipiert und liefert umfassendere, klarere und strengere Antworten als einfache Fragen.

Allerdings unterstützt es derzeit nur die Nutzung über das Internet, keine API-Aufrufe und nur ein tägliches Kontingent von 50 Nutzungen.

Darf nicht ohne Genehmigung vervielfältigt werden:KI-Produktivitätswerkzeuge » DeepSeek-R1-Lite, ein selbst entwickeltes Inferenzmodell vergleichbar mit o1-preview, ist online!

DeepSeek-R1-Lite, ein selbst entwickeltes Inferenzmodell vergleichbar mit o1-preview, ist online!

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Beliebte AI-Tools

Neue Veröffentlichungen

Neueste AI-Tools

DeepSeek-R1-Lite, ein selbst entwickeltes Inferenzmodell vergleichbar mit o1-preview, ist online!

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Beliebte AI-Tools

Neue Veröffentlichungen

Neueste AI-Tools

Schnellabfragestation AI-Tool