Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Search-R1 ist ein Open-Source-Tool zur Optimierung der Such- und Inferenzfähigkeiten großer Sprachmodelle auf der Grundlage von Reinforcement-Learning-Techniken

2025-08-27 1.2 K

Technische Grundprinzipien von Search-R1

Search-R1 ist ein Open-Source-Projekt auf GitHub, das von PeterGriffinJin entwickelt wurde und dessen zentrale technische Architektur auf dem veRL-Framework aufbaut. Das Projekt verwendet Verstärkungslernen (Reinforcement Learning, RL) als zentrale Trainingsmethode, die die autonomen Such- und Schlussfolgerungsfähigkeiten großer Sprachmodelle (LLM) erheblich verbessert. Das Projekt unterstützt die aktuellen Mainstream-Open-Source-Modelle Qwen2.5-3B und Llama3.2-3B und erzielt technische Durchbrüche durch die Erweiterung der DeepSeek-R1- und TinyZero-Methoden.

  • Innovative Anwendung von RL-Techniken für das Training der LLM-Suchfähigkeit
  • Komplexe Trainingsszenarien, die die Bearbeitung von Aufgaben in mehreren Runden unterstützen
  • Vollständiger Code, Datensätze und Versuchsprotokolle verfügbar

Das System wurde in einem technischen Papier (März 2025) veröffentlicht, und alle Modelle und Datenressourcen sind über die Hugging Face-Plattform verfügbar, die Forschern und Entwicklern eine Komplettlösung bietet.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang

de_DEDeutsch