SpatialLM: Durchstöbern Sie den Raum und AI zeichnet automatisch das 3D-Modell für Sie!
SpatialLM是一个专门为处理三维(3D)点云数据而设计的大语言模型。它的核心功能是理解非结构化的3D几何数据,并将其转化为结构化的3D场景表示。这些结构化输出包含了建筑元素(如墙壁、门、窗)以及带方向的物体...
Baichuan-M2: Ein großes Sprachmodell für Augmented Reasoning im Gesundheitswesen
Baichuan-M2 是百川智能公司推出的一个参数量为320亿(32B)的开源大语言模型。 该模型专注于医疗领域,旨在处理真实世界的医疗推理任务。它基于Qwen2.5-32B模型进行二次开发,通过引入创新的“大型验证器系统”(L...
Genie 3: Generierung virtueller Welten, mit denen man in Echtzeit interagieren kann
Genie 3 ist ein generisches Weltmodell (Weltmodell), das von Google DeepMind veröffentlicht wurde und den neuesten Fortschritt in der KI zur Simulation und Erstellung virtueller Umgebungen darstellt. Die wichtigste Eigenschaft des Modells ist, dass es eine vielfältige und dynamische Welt generieren kann, die Echtzeit-Interaktion auf der Grundlage einer textuellen Beschreibung unterstützt...
HRM: Hierarchische Begründungsmodelle für komplexes Begründen
HRM (Hierarchical Reasoning Model) ist ein hierarchisches Denkmodell mit nur 27 Millionen Parametern, das für die Lösung komplexer Denkaufgaben im Bereich der künstlichen Intelligenz entwickelt wurde. Das Design des Modells ist inspiriert von der hierarchischen, mehrzeitskaligen Informationsverarbeitung des menschlichen Gehirns. Es wird durch ein High-Level-Modul modelliert (negative .....
Seed Diffusion: Validierung von Hochgeschwindigkeits-Sprachmodellen für Architekturen der nächsten Generation
Seed Diffusion ist ein experimentelles Sprachmodell, das vom ByteDance Seed Team in Zusammenarbeit mit der Academy of Intelligent Industry Research (AIR) an der Tsinghua Universität entwickelt wurde. Diese Website ist eine Technologie-Demonstrationsplattform für das Modell. Das Modell basiert auf der diskreten Diffusionstechnik, und das Hauptziel besteht darin, den zugrunde liegenden Rahmen des Sprachmodells der nächsten Generation zu erforschen, das...
HunyuanWorld-1.0: Interaktive 360°-3D-Welten aus Text oder Bildern generieren
HunyuanWorld-1.0 ist ein Open-Source-Projekt, das von Tencents Hunyuan-Team entwickelt wurde und darauf abzielt, interaktive 360°-3D-Welten durch Textbeschreibungen oder Einzelbilder zu erzeugen. Es verwendet Panorama-Agenten-Generierung, semantische Schichtung und hierarchische 3D-Rekonstruktionstechniken, um qualitativ hochwertige, erkundbare 3D-Szenen zu erzeugen. Das Projekt basiert auf dem Flux-Framework...
Qwen3-MT: Ein intelligentes Übersetzungsprogramm für 92 Sprachen
Qwen3-MT ist ein intelligentes Übersetzungstool, das vom Alibaba Cloud Qwen-Team entwickelt wurde und auf dem leistungsstarken Qwen3 Big Language Model basiert. Es unterstützt die Übersetzung von 92 Sprachen und wichtigen Dialekten und deckt damit mehr als 95% der Weltbevölkerung ab. Benutzer können die effiziente Übersetzung über die Qwen-API oder die Online-Demoseite .... testen.
OpenMed: eine Open-Source-Plattform für kostenlose KI-Modelle im Gesundheitswesen
OpenMed ist eine Open-Source-KI-Modellierungsplattform für das Gesundheitswesen und die Biowissenschaften, die auf Hugging Face gehostet wird und mehr als 380 kostenlose Named-Entity-Recognition-Modelle (NER) anbietet, die sich auf die Extraktion von Schlüsselinformationen wie Medikamenten, Krankheiten, Genen und anatomischen Strukturen aus klinischen Texten und Forschungsliteratur konzentrieren....
Seed-X-7B: ein großes Modell für effiziente mehrsprachige Übersetzung
Seed-X-7B ist ein quelloffenes, mehrsprachiges Übersetzungs-Großsprachenmodell, das vom Seed-Team von ByteDance entwickelt wurde und sich auf die Bereitstellung effizienter und genauer Übersetzungsfunktionen konzentriert. Es basiert auf der Mistral-Architektur mit 7B-Parametern und unterstützt die Übersetzung in 28 Sprachen, die ein breites Spektrum von Bereichen wie Internet, Technologie, E-Commerce und Biomedizin abdecken....
Qwen3-Coder: Open-Source-Code-Generierung und intelligenter Programmierassistent
Qwen3-Coder ist eine Familie von Open-Source-Sprachmodellen in großem Maßstab, die vom Alibaba Cloud Qwen-Team entwickelt wurde und sich auf Codegenerierung und intelligente Programmierung konzentriert. Das Kernprodukt ist Qwen3-Coder-480B-A35B-Instruct, ein Hybrid Model of Expertise (MoE) mit 48 Milliarden Parametern, aktiviert...
EduChat: ein Open-Source-Modell für den Bildungsdialog
EduChat ist ein Open-Source-Dialogmodell für den Bildungsbereich, das vom ICALK-Team der East China Normal University entwickelt wurde. Es konzentriert sich auf Bildungsszenarien, unterstützt chinesische und englische Dialoge und zielt darauf ab, intelligente Dialogwerkzeuge für Studenten, Lehrer und Forscher bereitzustellen. Das Modell basiert auf Open-Source-Frameworks wie LLaMA, Qwen usw., und durch eine große Anzahl von Daten aus dem Bildungsbereich...
MedGemma: eine Sammlung von quelloffenen KI-Modellen für medizinisches Text- und Bildverständnis
MedGemma ist eine Reihe von Open-Source-KI-Modellen, die von Google auf der Hugging Face-Plattform veröffentlicht wurden und sich auf das Text- und Bildverständnis im medizinischen Bereich konzentrieren. Es basiert auf dem Modell Gemma 3 und soll Entwicklern helfen, KI-Anwendungen für das Gesundheitswesen zu entwickeln.MedGemma bietet eine Vielzahl von Modellvarianten...
Jan-nano: ein leichtes und effizientes Modell für die Texterstellung
Jan-nano ist ein auf der Qwen3-Architektur optimiertes Sprachmodell mit 4 Milliarden Parametern, das von Menlo Research entwickelt und auf der Hugging Face-Plattform gehostet wird. Es ist für eine effiziente Texterzeugung konzipiert und kombiniert geringe Größe und lange Kontextverarbeitungsfähigkeiten für lokale oder eingebettete Umgebungen. Das Modell unterstützt...
Zerank-1: Ein Umordnungsmodell zur Verbesserung der Genauigkeit von Suchergebnissen
Zerank-1 ist ein fortschrittliches Rerankermodell, das von ZeroEntropy entwickelt wurde. Es spielt eine Schlüsselrolle als "zweiter Filter" in Information Retrieval oder semantischen Suchsystemen. Erstens findet ein vorläufiges Retrievalsystem (z. B. eine Vektorsuche) schnell eine große Anzahl von Dokumenten aus einer ...
Windsurf SWE-1
SWE-1: Eine neue Generation modernster Modelle für das Software-Engineering Vor kurzem wurde die mit Spannung erwartete Modellfamilie SWE-1 veröffentlicht. Diese Modellfamilie wurde entwickelt, um den gesamten Softwareentwicklungsprozess zu optimieren, und geht weit über die traditionelle Aufgabe des Codeschreibens hinaus. Derzeit besteht die SWE-1-Familie aus drei gut positionierten Modellen:...
LaWGPT
LaWGPT ist ein Open-Source-Projekt, das von der Forschungsgruppe für maschinelles Lernen und Data Mining der Universität Nanjing unterstützt wird und sich dem Aufbau eines großen Sprachmodells auf der Grundlage des chinesischen Rechtswissens widmet. Es erweitert die proprietären Wortlisten im juristischen Bereich auf der Grundlage generischer chinesischer Modelle (z. B. Chinese-LLaMA und ChatGLM) und durch groß angelegte...
Hibiki: ein Echtzeit-Sprachübersetzungsmodell, eine Streaming-Übersetzung, die die Eigenschaften der Originalstimme bewahrt
Hibiki ist ein von Kyutai Labs entwickeltes Echtzeit-Sprachübersetzungsmodell mit hoher Wiedergabetreue. Im Gegensatz zu herkömmlichen Offline-Übersetzern ist Hibiki in der Lage, natürliche Sprachübersetzungen in der Zielsprache zu generieren und Textübersetzungen in Echtzeit zu liefern, während der Benutzer spricht. Das Modell verwendet eine Multi-Stream-Architektur und ist in der Lage, die Eingabesprache gleichzeitig zu verarbeiten...
zurück zum Anfang