
SpatialLM: Durchstöbern Sie den Raum und AI zeichnet automatisch das 3D-Modell für Sie!
SpatialLM ist ein umfangreiches Sprachmodell, das speziell für die Verarbeitung dreidimensionaler (3D) Punktwolkendaten entwickelt wurde. Seine Hauptfunktion besteht darin, unstrukturierte geometrische 3D-Daten zu verstehen und sie in strukturierte 3D-Szenendarstellungen umzuwandeln. Diese strukturierten Ausgaben enthalten architektonische Elemente (z. B. Wände, Türen, Fenster) sowie Objektbegrenzungsrahmen mit Orientierung und ihren semantischen Kategorien. Im Gegensatz zu den vielen Anforderungen ...

Baichuan-M2: Ein großes Sprachmodell für Augmented Reasoning im Gesundheitswesen
Baichuan-M2 ist ein quelloffenes großes Sprachmodell mit 32 Milliarden (32B) Parametern von Baichuan Intelligence. Das Modell konzentriert sich auf den medizinischen Bereich und ist für die Bearbeitung realer medizinischer Schlussfolgerungen konzipiert. Es basiert auf dem Qwen2.5-32B-Modell, das durch die Einführung eines innovativen “Large Language Model” entwickelt ...

Genie 3: Generierung virtueller Welten, mit denen man in Echtzeit interagieren kann
Genie 3 ist ein generisches Weltmodell (Weltmodell), das von Google DeepMind veröffentlicht wurde und den neuesten Fortschritt in der KI bei der Simulation und Erstellung virtueller Umgebungen darstellt. Das Hauptmerkmal dieses Modells ist, dass es eine vielfältige und dynamische Welt generieren kann, die Echtzeit-Interaktionen allein auf der Grundlage einer textuellen Beschreibung unterstützt. Benutzer können diese...

HRM: Hierarchische Begründungsmodelle für komplexes Begründen
HRM (Hierarchical Reasoning Model) 是一个仅有2700万参数的层级式推理模型,旨在解决人工智能领域中复杂的推理任务。该模型的设计灵感来源于人脑的层级式、多时间尺度的信息处理方式。 它通过一个高层模块(负责缓...

Seed Diffusion: Validierung von Hochgeschwindigkeits-Sprachmodellen für Architekturen der nächsten Generation
Seed Diffusion 是一个实验性的语言模型,由字节跳动Seed团队联合清华大学智能产业研究院(AIR)共同推出。这个网站是该模型的技术演示平台。该模型基于离散扩散技术,主要目标是探索下一代语言模型基础框架的可行性。它在代码生成这个...

HunyuanWorld-1.0: Interaktive 360°-3D-Welten aus Text oder Bildern generieren
HunyuanWorld-1.0 是腾讯混元团队开发的一个开源项目,旨在通过文字描述或单张图像生成可交互的360° 3D世界。它采用全景代理生成、语义分层和层次化3D重建技术,生成高质量、可探索的3D场景。项目基于 Flux 框架,支持与 ...

Qwen3-MT: Ein intelligentes Übersetzungsprogramm für 92 Sprachen
Qwen3-MT 是由阿里巴巴云 Qwen 团队开发的一款智能翻译工具,基于强大的 Qwen3 大语言模型。它支持 92 种语言和主要方言的翻译,覆盖全球 95% 以上的人口。用户可以通过 Qwen API 或在线演示页面体验其高效的翻译功...

OpenMed: eine Open-Source-Plattform für kostenlose KI-Modelle im Gesundheitswesen
OpenMed 是一个致力于医疗和生命科学领域的开源AI模型平台,托管于 Hugging Face。它提供超过380个免费的命名实体识别(NER)模型,专注于从临床文本和研究文献中提取关键信息,如药物、疾病、基因和解剖结构等。这些模型全部基...

Seed-X-7B: ein großes Modell für effiziente mehrsprachige Übersetzung
Seed-X-7B 是由字节跳动 Seed 团队开发的一款开源多语言翻译大语言模型,专注于提供高效、准确的翻译功能。它基于 7B 参数的 Mistral 架构,支持 28 种语言的翻译,覆盖互联网、科技、电商、生物医学等多个领域。模型通过预...

Qwen3-Coder: Open-Source-Code-Generierung und intelligenter Programmierassistent
Qwen3-Coder ist eine Familie von Open-Source-Sprachmodellen in großem Maßstab, die vom Alibaba Cloud Qwen-Team entwickelt wurde und sich auf Codegenerierung und intelligente Programmierung konzentriert. Das Kernprodukt ist Qwen3-Coder-480B-A35B-Instruct, ein Hybrid Model of Expertise (MoE) mit 48 Milliarden Parametern, aktiviert...

EduChat: ein Open-Source-Modell für den Bildungsdialog
EduChat 是由华东师范大学 ICALK 团队开发的一个开源教育对话模型。它专注于教育场景,支持中英文对话,旨在为学生、教师和研究人员提供智能化的对话工具。模型基于 LLaMA、Qwen 等开源框架,通过大量教育领域数据进行微调,具备处...

MedGemma: eine Sammlung von quelloffenen KI-Modellen für medizinisches Text- und Bildverständnis
MedGemma ist eine Reihe von Open-Source-KI-Modellen, die von Google auf der Hugging Face-Plattform veröffentlicht wurden und sich auf das Text- und Bildverständnis im medizinischen Bereich konzentrieren. Es basiert auf dem Modell Gemma 3 und soll Entwicklern helfen, KI-Anwendungen für das Gesundheitswesen zu entwickeln.MedGemma bietet eine Vielzahl von Modellvarianten...

Jan-nano: ein leichtes und effizientes Modell für die Texterstellung
Jan-nano ist ein auf der Qwen3-Architektur optimiertes Sprachmodell mit 4 Milliarden Parametern, das von Menlo Research entwickelt und auf der Hugging Face-Plattform gehostet wird. Es ist für eine effiziente Texterzeugung konzipiert und kombiniert geringe Größe und lange Kontextverarbeitungsfähigkeiten für lokale oder eingebettete Umgebungen. Das Modell unterstützt...

Zerank-1: Ein Umordnungsmodell zur Verbesserung der Genauigkeit von Suchergebnissen
Zerank-1 是由 ZeroEntropy 公司开发的一款先进的重排序(reranker)模型。 在信息检索或语义搜索系统中,它扮演着“第二道筛选器”的关键角色。 首先,一个初步的检索系统(如向量搜索)会从海量的文档库中快速找出一批可能...

Windsurf SWE-1
SWE-1: 软件工程领域的新一代前沿模型问世 近日,业界瞩目的 SWE-1 系列模型正式发布。该系列模型专为优化整个软件工程流程而设计,其目标远不止于传统的代码编写任务。 当前,SWE-1家族包含三款定位清晰的模型: SWE-1: 这款主...

LaWGPT
LaWGPT ist ein Open-Source-Projekt, das von der Forschungsgruppe für maschinelles Lernen und Data Mining der Universität Nanjing unterstützt wird und sich dem Aufbau eines großen Sprachmodells auf der Grundlage des chinesischen Rechtswissens widmet. Es erweitert die proprietären Wortlisten im juristischen Bereich auf der Grundlage generischer chinesischer Modelle (z. B. Chinese-LLaMA und ChatGLM) und trainiert sie mit einem großen juristischen Korpus...

Hibiki: ein Echtzeit-Sprachübersetzungsmodell, eine Streaming-Übersetzung, die die Eigenschaften der Originalstimme bewahrt
Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模型采用多流架构,能够同时处理输入语音流并生成目标语...
zurück zum Anfang