Zugang aus Übersee: www.kdjingpai.com

Ctrl + D Lesezeichen für diese Seite

Große Modell-Feinabstimmung

 Website einreichen

LLaMA-Factory Online
LLaMA-Factory Online: kein Code, einfache Feinabstimmung 1. Einführung: (Out-of-the-box, low-code, full-link funktionale Abdeckung der Online-Plattform für Training und Feinabstimmung großer Modelle LLaMA-Factory Online ist die offizielle Kooperation mit dem Star-Open-Source-Projekt LLaMA-Factory ...
10-25 1.4 K0Gelobt
Qwen3-FineTuning-Playground: eine einsatzbereite Codebasis für die Feinabstimmung der großen Modelle von Qwen3.
Qwen3-FineTuning-Playground ist ein Open-Source-Projekt, das eine komplette Codebasis für die Feinabstimmung der Qwen3-Familie großer Sprachmodelle bereitstellt. Die Grundlage dieses Projekts ist es, klare, professionelle und leicht erweiterbare Code-Beispiele für die Feinabstimmung bereitzustellen, so dass Entwickler und Forscher leicht eine Vielzahl von Mainstream-Mikromodellen anwenden können...
08-28 2.3 K0Gelobt
Verifiers: eine Bibliothek von Verstärkungslernumgebungen für das Training großer Sprachmodelle
Verifiers ist eine Bibliothek mit modularen Komponenten zur Erstellung von Reinforcement Learning (RL)-Umgebungen und zum Training von Large Language Modelling (LLM)-Agenten. Das Ziel dieses Projekts ist es, eine Reihe von zuverlässigen Werkzeugen bereitzustellen, die es Entwicklern ermöglichen, LLM-Agenten einfach zu erstellen, zu trainieren und zu evaluieren. Verifiers enthält eine transformationsbasierte ...
08-28 2.2 K0Gelobt
Radal: eine Low-Code-Plattform für die schnelle Feinabstimmung und Optimierung von KI-Modellen
Radal ist eine Low-Code-Plattform, die Unternehmen bei der schnellen Erstellung und Optimierung von KI-Modellen unterstützt. Sie ermöglicht Nutzern das Trainieren von Large Language Models (LLMs) ohne tiefgreifende Programmierung durch eine intuitive Schnittstelle und KI-unterstützte Funktionen. Die von einem Team aus Branchenexperten und Start-ups entwickelte Plattform legt den Schwerpunkt auf effiziente, maßgeschneiderte KI-Lösungen für das Gesundheitswesen, die Finanzbranche, die Immobilienbranche...
08-04 1.5 K0Gelobt
WhiteLightning: ein Open-Source-Tool zur Erstellung von leichtgewichtigen Offline-Textklassifikationsmodellen mit einem Klick
WhiteLightning ist ein Open-Source-Befehlszeilen-Tool, das Entwicklern helfen soll, mit einer einzigen Befehlszeile schnell leichtgewichtige Textklassifikationsmodelle zu erstellen. Das Tool generiert synthetische Daten unter Verwendung eines großen Sprachmodells und trainiert ONNX-Modelle von weniger als 1 MB durch Fakultätsstudenten-Destillationstechniken, unterstützt den vollständigen Offline-Betrieb und eignet sich für Edge-Geräte wie Raspberry Pi, Mobiltelefone oder Low-Power-Geräte.
08-04 1.6 K0Gelobt
FineTuningLLMs: Ein praktischer Leitfaden zur effizienten Feinabstimmung großer Sprachmodelle auf einem einzigen Grafikprozessor
FineTuningLLMs ist ein GitHub-Repository des Autors dvgodoy, das auf seinem Buch A Hands-On Guide to Fine-Tuning LLMs with PyTorch and Hugging Face basiert. Dieses Repository...
07-09 1.3 K0Gelobt
ReCall: Training großer Modelle für die Inferenz von Werkzeugrufen durch Verstärkungslernen
ReCall ist ein Open-Source-Framework, das entwickelt wurde, um Large Language Models (LLMs) für den Aufruf von Tools und Inferenzen durch Reinforcement Learning zu trainieren, ohne auf überwachte Daten angewiesen zu sein. ReCall unterstützt benutzerdefinierte Werkzeuge und eignet sich für die Entwicklung von Allzweckintelligenz. Das Projekt basiert auf ...
07-01 2.1 K0Gelobt
GraphGen: Feinabstimmung von Sprachmodellen mithilfe von Wissensgraphen zur Erzeugung synthetischer Daten
GraphGen ist ein Open-Source-Framework, das von OpenScienceLab, einem KI-Labor in Shanghai, entwickelt wurde und auf GitHub gehostet wird. Es konzentriert sich auf die Optimierung der überwachten Feinabstimmung von Large Language Models (LLMs), indem es die Erzeugung synthetischer Daten durch Wissensgraphen anleitet. Es konstruiert feinkörnige Wissensgraphen aus dem Ausgangstext unter Verwendung von Expected Calibration Error (ECE)...
05-05 3.2 K0Gelobt
MiniMind-V: 1 Stunde Training von 26M parametrischen visuellen Sprachmodellen
MiniMind-V ist ein Open-Source-Projekt, das auf GitHub gehostet wird und Benutzern helfen soll, ein leichtgewichtiges visuelles Sprachmodell (VLM) mit nur 26 Millionen Parametern in weniger als einer Stunde zu trainieren. Es basiert auf dem MiniMind-Sprachmodell, dem neuen visuellen Kodierer und dem Modul für die Merkmalsprojektion sowie der Unterstützung für die gemeinsame Verarbeitung von Bildern und Text. Das Projekt ...
04-14 3.5 K0Gelobt
DeepCoder-14B-Preview: ein Open-Source-Modell, das sich bei der Codegenerierung auszeichnet
DeepCoder-14B-Preview ist ein Open-Source-Modell zur Codegenerierung, das vom Agentica-Team entwickelt und auf der Hugging Face-Plattform veröffentlicht wurde. Es basiert auf DeepSeek-R1-Distilled-Qwen-14B, optimiert durch verteilte Reinforcement Learning (RL) Techniken...
04-10 2.5 K0Gelobt
WeClone: Ausbildung von digitalen Doppelgängern mit WeChat-Chat-Protokollen und Stimmen
WeClone ist ein Open-Source-Projekt, mit dem Nutzer personalisierte digitale Doppelgänger erstellen können, indem sie Chatprotokolle und Sprachnachrichten von WeChat mit großen Sprachmodellen und Sprachsynthesetechnologie kombinieren. Das Projekt kann die Chat-Gewohnheiten eines Nutzers analysieren, um das Modell zu trainieren, und kann außerdem mit einer kleinen Anzahl von Stimmproben realistische Stimmklone erzeugen. Schließlich kann der digitale Doppelgänger mit einem WeChat-Bot verbunden werden, um die Kommunikation zu automatisieren...
04-08 2.8 K0Gelobt
Search-R1: Verstärkungslernen zum Trainieren großer Modelle für Suche und Schlussfolgerungen
Search-R1 ist ein Open-Source-Projekt, das von PeterGriffinJin auf GitHub entwickelt wurde und auf dem veRL-Framework aufbaut. Es nutzt Techniken des Reinforcement Learning (RL), um ein großes Sprachmodell (LLM) zu trainieren, so dass das Modell selbstständig lernt, zu argumentieren und die Suchmaschine aufzurufen, um Probleme zu lösen. Projektunterstützung Qwen2....
04-01 2.8 K0Gelobt
Optexity: ein Open-Source-Projekt zum Trainieren von KI für die Durchführung von Webaktionen mit menschlichen Demonstrationen
Optexity ist ein Open-Source-Projekt auf GitHub, das vom Optexity-Team entwickelt wurde. Sein Kern ist es, menschliche Demonstrationsdaten zu verwenden, um KI zu trainieren, um Computeraufgaben zu erledigen, insbesondere Webseitenoperationen. Das Projekt besteht aus drei Code-Bibliotheken: ComputerGYM, AgentAI und Playwright...
04-01 2.5 K0Gelobt
Bonsai: Ein dreiwertiges gewichtetes Sprachmodell, das für den Einsatz auf Randgeräten geeignet ist
Bonsai ist ein von deepgrove-ai entwickeltes Open-Source-Sprachmodell mit einer Parametergröße von 500 Millionen, das ternäre Gewichte verwendet. Es basiert auf der Llama-Architektur und dem Mistral-Klassifikator-Design, mit linearen Schichten, die zur Unterstützung ternärer Gewichte angepasst wurden. Das Modell verwendet hauptsächlich ...
03-26 2.5 K0Gelobt
Second Me: lokal trainierte KI-Doppelgänger mit persönlichen Erinnerungen und Gewohnheiten
Second Me ist ein vom Mindverse-Team entwickeltes Open-Source-Projekt, mit dem Sie eine KI auf Ihrem Computer erstellen können, die wie ein “digitaler Doppelgänger” agiert, Ihre Sprache und Gewohnheiten durch Ihre Worte und Erinnerungen lernt und zu einem intelligenten Assistenten wird, der Sie versteht. Das Beste daran ist, dass alle Daten lokal bleiben, sodass Sie sie nicht hochladen müssen...
03-24 3.9 K0Gelobt
Easy Dataset: Ein einfaches Tool zur Erstellung großer, fein abgestimmter Modelldatensätze
Easy Dataset ist ein Open-Source-Tool, das speziell für die Feinabstimmung großer Modelle (LLMs) entwickelt wurde und auf GitHub gehostet wird. Es bietet eine einfach zu bedienende Schnittstelle, die es Benutzern ermöglicht, Dateien hochzuladen, Inhalte automatisch zu segmentieren, Fragen und Antworten zu generieren und schließlich strukturierte Datensätze auszugeben, die für die Feinabstimmung geeignet sind. Der Entwickler Conard Li hat ...
03-21 3.2 K0Gelobt
MM-EUREKA: Ein multimodales Reinforcement Learning Tool zur Erforschung des visuellen Denkens
MM-EUREKA ist ein Open-Source-Projekt, das vom Shanghai Artificial Intelligence Laboratory der Shanghai Jiao Tong University und anderen Parteien entwickelt wurde. Es erweitert die Fähigkeiten des textuellen Reasonings auf multimodale Szenarien durch regelbasierte Verstärkungslerntechniken, um Modelle bei der Verarbeitung von Bild- und Textinformationen zu unterstützen. Das Hauptziel dieses Tools ist es, die Leistung von Modellen bei visuellen und mathematischen Schlussfolgerungen zu verbessern. Es startet ...
03-18 2.4 K0Gelobt
AI Toolkit von Ostris: Stabile Diffusion mit FLUX.1 Model Training Toolkit
AI Toolkit von Ostris ist ein Open-Source-KI-Toolkit, das sich auf die Unterstützung von Stable Diffusion und FLUX.1-Modellen für Trainings- und Bilderzeugungsaufgaben konzentriert. Das vom Entwickler Ostris erstellte und gepflegte Toolkit, das auf GitHub gehostet wird, zielt darauf ab, Forschern und Entwicklern flexible Modellierungsmöglichkeiten zu bieten...
03-12 8.2 K0Gelobt
X-R1: Schulung von 0,5B-Modellen in gängigen Geräten zu geringen Kosten
X-R1 ist ein Reinforcement-Learning-Framework, das vom dhcode-cpp-Team auf GitHub zur Verfügung gestellt wird. Ziel ist es, Entwicklern ein kostengünstiges, effizientes Tool für das Training von Modellen auf Basis von End-to-End Reinforcement Learning zur Verfügung zu stellen. Inspiriert von DeepSeek-R1 und open-r1, konzentriert sich das Projekt auf den Aufbau eines einfachen...
03-11 2.2 K0Gelobt