Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

SmolDocling ist das kleinste visuelle Sprachmodell der Welt

2025-08-28 1.7 K
Link direktMobile Ansicht
qrcode

SmolDocling ist das kleinste Visual Language Model (VLM) der Welt in Bezug auf die Parametergröße und hat nur 256M Parameter. Es wurde gemeinsam vom ds4sd-Team und IBM entwickelt. Es basiert auf der schlanken Architektur SmolVLM-256M und zeichnet sich dadurch aus, dass es eine effiziente Dokumentenverarbeitung bei gleichzeitig geringer Größe ermöglicht. Im Vergleich zu herkömmlichen großen VLMs, die in der Regel Milliarden von Parametern benötigen, hat SmolDocling seine Modellkomprimierungstechniken speziell optimiert, damit es problemlos auf gewöhnlichen Computergeräten laufen kann. Das Open-Source-Hosting auf der Hugging-Face-Plattform senkt die Hürde für die Nutzung der Technologie weiter.

Das miniaturisierte Design des Modells hat mehrere Vorteile: Es reduziert die Speicherbelegung um mehr als 70%, verbessert die Inferenzgeschwindigkeit um mehr als das Zehnfache und unterstützt den Betrieb in Umgebungen ohne GPU. Experimentelle Daten zeigen, dass die Dokumenterkennungsgenauigkeit von 88,7% auch bei einer Parameterskala von 256M beibehalten werden kann, was besonders für eingebettete Geräte und Edge-Computing-Szenarien geeignet ist. Dieser miniaturisierte Implementierungsweg stellt einen wichtigen Durchbruch in der Entwicklung der VLM-Technologie in Richtung Leichtbau und Zivilisierung dar.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang

de_DEDeutsch